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Prefata 


Apariţia, teoriei moderne a probabilitatilor datează de la sfir- 
situl secolului nouăsprezece si primele trei decenii ale secolului două- 
zeci culminind cu axiomele lui Kolmogorov din 1933. 

Statistica a fost iniţiată chiar mai tirziu, conceptele de bază 
ale acestei discipline cristalizindu-se în primele patru decenii ale 
secolului nostru. Avalansa de periodice si monografii în acest domeniu 
care a început după cel de al doilea război mondial continuă şi în 
prezent cu o mare frecvență. 

În același timp, teoriile funcțiilor de variabilă reală şi complexă, 
care servesc ca fundamente si metode atit pentru argumentatia pro- 
babilistă cit si pentru cea statistică, şi-au atins maturitatea la sfirgitul 
secolului nouăsprezece. În fapt, lucrările lui H. Lebesgue si A. Picard 
pot fi considerate ca dezvoltarea finală a acestor teorii, cel ‘putin cu 
aplicații la teoria probabilităților şi statistica matematică. 

Teoria probabilităților şi statistica matematică sint bazate pe 
un număr de concepte specifice care devin mai simple în semnificaţie 
cînd este făcută trecerea în terminologia matematicii pure. Unul 
dintre aceste concepte tipice este conceptul de funcţie de repartiție 
care este o funcţie continuă la stînga, nedescrescătoare si uniform 
mărginită; mai mult, repartiţia sumei a două variabile aleatoare 
independente corespunde la convolutia celor două funcţii de repartiție 
corespunzătoare. Unele forme ale mediei condiţionate corespund la 
integrale definite; media statisticilor de ordine poate fi exprimată 
'à o integrală dintr-un polinom de funcţia de repartiție etc. Pe de 
altă parte, tără această trecere, poate rezulta, folosirea necriticá a 
conceptelor teoriei probabilităților şi ale statisticii matematice. 
Aceasta, în loc să lămurească structura și proprietăţile noţiunilor de 
bază din aceste discipline, produce confuzii 81 adeseori interpretări 
complet eronate. 


Dezvoltarea, teoriei probabilităților a fost dominată de repartiţia, 
normală. Ea pornește cu Doctrina of Chances (De Moivre (1713)) 
continuă cu contribuţiile lui Laplace şi Gauss (secolul nouăsprezece) 
si culminează, cu rezultatele legate de teorema limită centrală, (înce- 
putul secolului douăzeci). Influenţa repartitiei normale în statistica, 
matematică este şi mai mare și numai în ultimele două decenii avem 
0 ușoară reţinere în acceptarea, ei. universală. Dezvoltarea curbelor 
lui Pearson şi dezvoltările în serii Gram-Charlier şi Edgeworth din 
acest secol sint, formal, generalizările densităţii normale Nu este 
lipsit de interes să vedem cum se explică interesul pentru repartiţia 
normală. Mai întîi forma graficului densităţii normale este apropiată, 
de multe grafice de densități convexe. De aceea, dacă nu cunoaştem 
exact natura, unei astfel de densități sau îi cunoaştem forma, nu însă, 
81 parametrii putem să presupunem, într-o primă aproximare că 
densitatea este normală şi să verificám dacă aceasta presupunere este 
adevărată. În al doilea rind, repartitiile care, nu sint normale pot fi 
uneori aduse la o formă, aproximativ, normală, printr-o schimbare 
de variabilă. În fine, există un procedeu cu, ajutorul căruia putem 
exprima 0 densitate de repartiție dată sub forma unei: serii infinite 
ai cărei termeni depind de mărimea, exp (= z?/2). 

i O altă, repartiție ce reprezintă interes istorie gi importanţă intrin- 
secă în statistica, matematică, este repartiţia, binominală introdusă de 
J. Bernoulli în jurul anului 1700. Această repartiție împreună cu 
repartiţia, normală constitue din punct de vedere istorie şi logie 
punctul de plecare al teoriei altor repartitii. i 

Repartiția exponential’ apare in literatura statistică mai tirziu 
În anul 1931, T. Kondo în lucrarea; sa, Theory of Sampling Distribution 
of Standard Deviation din Biometrika: se referă, la, repartitia exponen- 
fiala ca la curba Pearson de tipul X. Această repartiție apare în actua- 
riat, biologie si în inginerie. P. V Sukhatame a fost probabil primul 
care în anul 1937 în Tests of significance for samples of the y? population 
with two degrees of freedom sugerează că repartiția exponențială (pe 
care el o numește chi pătrat; cu două grade de libertate) poate servi 
ca alternativă la repartitiile normale în tipul de probleme în care forma, 
variaţiei în populaţie este cunoscută, si este departe de esa normală. 
Sukhatame determină repartiția comună, a, diferenţelor statisticilor 
de ordine dintr-o repartiție exponențială, din care ürmeazá un rezultat 
de bază : pentru repartiţia exponențială, diferenţele statisticilor da 

ordine sint; independente şi repartizate exponential. W. Weibull in 
anul 1951 în lucrarea 4 statistical distribution funotion of wide appli- 
cability din J. Appl: Mech. dă o extensie a repartiţiei exponentiale 
extensi e ce-i poartă numele. 10109 
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Studiul. aprofundat al proprietăţilor repartitiilor exponentiale 
incepe în anul 1953 cînd B. Epstein si M. Sobel, publică articolul 
Life testing in J. Amer. Statist. Assoc. În continuare sint de remarcat : 
Continuous Univariate Distributions I. p. 228—232 de N. L. Johnson 
şi S. Kotz (1969), Multivariate Continuous Distributions de, Johnson 
si Kotz (1972), The Asymptotic Theory of Extreme Order Statistics 
(1978). apărute in, John. Wiley si, Characterization of Probability 
Distributions. de J. Galambos şi S. Kotz apărută in anul 1978. 

Asocierea acestor repartitii (precum $i a altora) eu modelele ma- 
tematice ce apar în diferite domenii ale cunoașterii explică interesul 
crescînd privind problema concordantei. 

Problema: de concordanță (sau de ajustare) este următoarea : 
fiind dată o selecţie 2, 25, 04 ی‎ 2, să'se verifice ipoteza Hy conform 
căreia selecţia a fost efectuată asupra unei variabile aleatoare X cu 
funcţia de repartiție F(x). Testul clasic pentru aceasta, problema, este 
testul X2, care are, anumite avantaje : 

i) este aplicabil. si, in, cazul, cînd (a) este. discontinuă, adică 
reprezintă, o repartiție discretă si 

ii) este, cunoscut cum, se, foloseşte, statistica, in cazul, in. care 
parametrii funcţiei F(4) trebuie estimati din selecţie. 

O altă clasă de teste de concordanţă (sau. de ajustare) este bazată 

pe compararea functiei de repartiție empirică (notată F,(%) sau S,(2)) 
cu o funcţie de repartiție F(x). Pentru cazul cînd F(x) este continuă 
şi complet specificată (să-l notăm cazul 0) aceste teste dau, pentru 
verificarea ipotezei Ho teste mai puternice decit X?. Ele prezintă 
dezavantajul că nu sînt adaptate bine pentru repartitii discrete în 
cazul cînd parametrii trebuie estimati. Aceasta, împreună cu, faptul 
:ă ele se calculează mai greu decît X? a creat neîncrederea în legătură 
cu aplicarea lor in practică. In ultimul timp s-au adaptat aceste 
statistici pentru unele cazuri importante, §i anume: Cazul 1(2): 
F(a) este funcţia de repartiție a unei variabile normale cu c*(1.) eunos- 
cută si u(02)estimată prin si respectivi( }} (ri )?/n) p Cazul 3; F( 2) 
este funcţia de repartiție a unei variabile normale cu y şi o? necu- 
noscute si estimate prin 2 si s? = Vi(a, — 7)/(n,— 1): Cazul 4; 
F(a) = 1 — exp (— 02), cu 0 estimat prin ۰ 

De asemenea, sînt adaptate pentru repartiţia valorii extreme de 
funcţie: de repartiție F(x) = exp [— exp (— (2 — 8)/0)], =o < 
< a < co, repartiție ce dă o ajustare bună pentru datele rezul- 
tate din experienţele clinice asupra subiecţilor, bătrîni și repartiţia 
logistică cu funcţia de repartiție P(z) = [1 + exp { — (2 — «)/Bj jm 
(cu & reprezentind timpul), care a fost tolosită pentru a reprezenta 
funcţiile de creștere. Sint făcute studii de putere pentri cazul 0 
şi pentiu vetificarea normalitátii; Pentru acest ultim caz testele! D 
si V cin această clasă au puterea mai mică decit; testul W. (Shapiro- 
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Wilk (1965)) în timp ce W?, U2 si A? au puteri comparabile cu W 
$1 cu care sint corelate puternic. Din punct de vedere practic, sint 
de preferat testele bazate pe compararea funcţiei de repartiție empirică, 
cu funcția de repartiție teoretică, deoarece acestea nu necesita coefi- 
cienti speciali pentru fiecare n. În cazul in care funcția de repartiție 
se calculează greu se foloseşte un test de ajustare bazat pe distanța 
dintre funcția caracteristică teoretică si cea empirică. Acest test este 
superior atît testului Kolmogorov-Smirnov, cît şi testului X? (se 
aplică atît pentru repartitii continui, cît şi discrete, înlătură în cazul 
continuu pierderea de informație datorită grupării datelor în intervale 
precum si arbitrarul în alegerea intervalelor). 

Pentru verificarea normalitátii se mai folosesc transformări care 
înlocuiesc ipoteza compusă printr-o ipoteză simplă ; statistici de tip 
coeficient de corelaţie si U statisticii. 

Am încercat sá stringem la un loc cele mai reprezentative teste 
de concordanţă, să vedem ce legături există între ele, să le comparăm 
puterile și să dăm cele mai adecvate forme de aplicare a lor. 

Totodată am încercat să facem o apropiere, sperăm reuşită, 
intre aceste capitole ale statisticii şi calculator. În acest scop majori- 
tatea, capitolelor contin un ultim paragraf in care sint prezentate 
programe și subprograme în limbaj FORTRAN pentru unele din 
noțiunile prezentate în capitolul respectiv. Au fost date explicații 
privind modul de folosire al programelor pe un sistem de calcul 
FELIX 0-256 pe care programul, pentru a fi executat, trebuie să fie 
însoţit de următoarele cartele : 


coloana 1 coloana 11 

| | 

Y ¥ 

e JOB n, AN : CCCC, PN : nume 
COMPILE FORTRAN 


cartelele cu programul și subprogramele folosite în program. 


LINK 
RUN 
[ cartele de date 
BOF 
۰ LOT 


În prima cartel semnificația parametrilor este : 
n — numele programului (cel mult opt litere şi cifre din care prima 
este litera) 
CCCC — codul programatorului (patru litere sau cifre) 
nume — numele programatorului (cel mult opt caractere) 
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Modul de prezentare al programelor și subprogramelor face 
posibilă utilizarea lor 81 de persoane ce nu au cunoştinţe de statistică, 
sau programarea calculatoarelor. In acest scop nu s-a insistat asupra 
metodelor folosite în programe şi subprograme, metode ce privese 
analiza numerică, analiza matematică, algebră, structuri de date ete. 
S-a insistat mai mult asupra semnificației parametrilor de intrare și 
iesire în subprograme, a tipului variabilelor, a limitelor valorilor 
variabilelor 81 a modului de prezentare a datelor pe cartelele de date 
si a rezultatelor la imprimantă. 

Schemele logice si programele sînt făcute conform cu indicaţiile 
date de Georgescu, Bâscă (1975). 


AUTORII 


Cuprins 


Capitolul 1. Testul X2 . 


9. 


CONT Oi ci Co وه‎ H 


„ Introducere 


Statistica X2. Aproxima ţia xi è 
X? — statistică test pentru y erificarea unei ipoteze simple.. 
X? — statistică pentru verificarea unei ipoteze compuse :; 


. Preprietáti ale testului X? . 


Alegerea claselor pentru testu] x? 

Statistica .X?. Aproximatia C(m) . 

Testul X? cu intervale aleatoare . 

8.1. Repartiția statisticii test în ipoteza nulă . k 
8.2. Regiunea critică bazată pe x? pentru verificarea normalitstit 


Teste pentru verificarea ipotezei conform căreia caracteristica sub cercetare este 
un vector normal 


10. Programe si subprograme F FORT RAN priv ind testul xs; 


4. 


Capitolul 2, Teste de concordanţă pentru repartifiile gama si exponențială <; 
1. 


. Rezultate asimptotice priv ind repartitia vectorilor de momente si funcții de 


Introducere 


momente. 5 . 
Statistica [7 și ۳ sa puntare 
3.1. Definiţia statisticii ó. Ay 

3. 2. Repartitia asimptotică a statisticii 0. 
0 test de concordanţă . 


Capitolul 3. Test de ajustare pentru repartiţia binomială. 


Testul C (a) pentru alternative binomiale corelate . 
Testul C (6) pentru alternative beta-binomiale . . . H 
Testul C (a) pentru alternative de multiplicare Altham i 


Programe si j qeste FORTRAN Mew ind testu] de "n stare e pentru reparti 
tia binomială EO 


Gapitolul 4. Teste de a justare pentru repartiţia Poisson. 


1. 


2. 
8. 


Introducere 
Teste de ajustare în cazul selecţiilor complete, , 
Teste de ajustare în cazul repartitiilor trunchiate . 


Gapitolul ^. Teste de tip Kolmogorov—Smirzov, 


1. 


Introducere. Funcţia de repartitie empirieă . 


Peet By PE iei to mea gf ene) os 


Statistici de tip Kolmogorov—Smirnov d OER 
3. Aplicaţii ale statisticii Kolmogorov—Smirnov pentru o selectie 
4, Puterea testului Kolmogorov—Smirnov 
5. Eficienţa testelor Kolmogorov—Smirnov O ARDEN a da 
6. Teste de ajustare in cazul repartitiilor incomplet specificate . 
6.1. Punerea problemei 
6.2. Testullui Lilliefors 
6.2.1. Cazul normal 
6.2.2. Cazul exponential 
6.3. Testul lui Srinivasan . 
6.3.1. Cazul exponential 
6.3.2. Cazul normal AAA 
6.4. Repartitiile limită ale statisticilor n1/2 D, şi ni? Dn 
6.4.1. Cazul exponential 
6.4.2. Cazul normal pie Os E SA MON a 
6.5. Teste Kolmogorov—Smirnov pentru exponentialitate . a eal A E ee 은 
Testul Kolmogorov—Smirnov pentru normalitatea erorilor experimentale 
într-un bloc aleator E CLIMEI ere ta dea Parse Aen 9 EN OE MANTIE 
8. Statistici Kolmogorov—Smirnov pentru date trunchiate şi censorizate 
8.1. Date trunchiate RSA A P rc 마우이: E ADN tiger aa 
8.2. Generalizári. Date censorizate ; Problema celor două selecţii . 
9. Testul Kolmogorov multidimensional 
10. Testul lui Massey Wife Ane E ES N ze RAU ac ac d EE 
11. Programe și subprograme FORTRAN privind testele de tip Kolmogorov — 
Smirnov . 


-apitolul 6, Testul Cramér—von Mis 
Introducere. Definiţii 1 wis, aes NCE at e Il dară cotat d 
Funcţia de repartiție a statisticii no; pentru selecţii de volum mic 1 
Punctele percentilice ale statisticii W? pentru diferite volume de selecţie . 


s. Testul Anderson— Darling . 


B) ~ ^ 


4. Componentele statisticilor Cramér-—von Mises și Anderson—Darling 
4.1. Statistica Cramer SAS 
4.2. Statistica Anderson—Darling E RAN Be bier Me M 
9. Statistici Cramér—von Mises generalizate pentru repartitia gama 


5.1. Componentele statisticii Cramér—von Mises generalizate . 
5.2. Verificarea exponentialitatii (cazul x = 1) 


E 
5.3. Eficienta asimptoticá relativá a componentelor statisticii Ry . : 
6. Statisticile Cramér—von Mises pentru verificarea normalitátii in selectii censo- 


rizate E A ice la a MO 

6.1. Statisticile Cramér—von Mises modificate n : 
A ud A ۲ 

6.2. Repartiția limită a procesului empiric 0200 | n {Fa t. 
3 


6.3. Repartitia asimptotică a statisticii ap Wa 
6.4. Verificarea normalitátii din date consorizate, 


media și dispersia fiind ne- 
cunoscute 


~I 


Verificarea exponentialitatii din datele censorizate cu 
Cramér—von Mises 

7.1. Introducere E ea 
7.2. Repartiția asimptotică Pret ag! e e. a a 
8. Subprogram FORTRAN pentru testul Cramér— von Mises . 


ajutorul statisticilor 


Capitolul 7. Testul Watson (Ux) 
1. Introducere A eene Peo aa NE AS D 
2. Functia de repartiție. Puncte percentilice 
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Rela ţia dintre repartitiile limita (N—=00) ale statisticilor Wy si Ux. 
1 f 
1. Gomponentele statisticii U2 — n (Fn(*) — x —\ Fae) — x)dxzydx . 
2 J 

Studii privind puterea. Test pentru normalitate 
Gontururi ale puterii P dS PL Rd 
Studiul puterii. Test pentru exponentialitate boris. a dh pl, e 
Statistica Uy pentru repartitii multinomiale Py(n;, Mg, ..., ng) (1.2.1) com- 
plet specificate 71۳ i 


9, Subprogram FORTRAN privind statistica Watson 


Capitolul 8. Festul Kuiper (Vy). 
Statistica Vy şi repartiția sa A viel 
Punctele de semnificație ale statisticii Vy. 
l'est de concordanţă bazat pe Vy. oe 
1 Alternativa de ajustare necorespunzatoare 
5.2. Alternativă de ajustare corespunzătoare 

|. Legătura dintre statisticile + 인 
Vn statistică test de tip reuniune-intersectie ۱ lat LP SNL rS oor Ri p 
Unele comparatii ale testelor de ajustare bazate pe functia de repartitie empi- 
rica ۰ P * à ۰ P " ۰ ۰ ۰ ㆍ ㆍ 
6.1. Etapele în aplicarea testului . 
6.2. Exemple i ی‎ ag eT 애기 pe vt 내기 MONET ela e e la 
Programe şi subprograme FORTRAN privind testul Kuiper . 


Capilolul 9. Feste de ajustare pentru repartiția valorii extreme 

1, Introducere pde ao TA o BOO pa de Si ARON apa ی‎ o A E i 
Teste bazate pe statisticile W2, U2 şi A2 şi pe modificárialeacestora . . . .. 
2.1. Algoritmul JAEN ARA DEA LEV 
2.2. Adaptare pentru repartiţia exponentialá Lo) 
l'este bazate pe statisticile Jn DF, Va D; , Yn D, si Inv . 

^1. Algoritmul 10008 St 기로 ARE Maa 

.2. Adaptare pentru repartiţia Weibull 

3. Adaptare pentru repartiţia exponentiala Na ach Res oc ei t bal LE 

t. Programe si subprograme FORTRAN privind testul de ajustare pentru reparti- 
lia valorii extreme 


«Apilolul 10, Teste de ajustare pentru repartiția logistică, 
Introducere 


Estima 


a parametrilor repartitiei 
Teste bazate pe statisticile W2, U? si A? 

iiec a hak iat 
Ceste bazate pe statisticile LP IN Dg ENS Nah, M E Loe cun 개 B 
Programe si subprograme FORTRAN privind testele de ajustare pentru re- 
partitia logistică bazate pe funcţia de repartiție empirică . 


Capitolul 11. Teste de ajustare pentru o ipo teză simplă bazate pe functia caracteris- 
tică empirică 


Introducere AN d e Le A PA a ete ee CoD as tog DIL 4 
2. Repartiția asimptotică a vectorilor de parti reale si imaginare a funcţiei 

caracteristice 

Teste de ajustare 


Capitolul 12. Inlocuirea ipotezelor compuse cu ipoteze simple echivalente 


Introducere , p be Porte A ir da 
2. Caracterizarea repartitiei exponentiale 


IN 


N 
or al 


“Iwi 


258 
260 
265 
265 


265 
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. Caracterizarea repartitiei normale . . . AAA O LAN pu RA 267 


A 239 a 4 
31. Pun pU Maat. es e erui SLUT eke ION Capitolul 20. Compararea testelor de normalitate . ㆍ ㆍ : SN UT 
3.2. Prin repartiţia uniformá . . . 268 UNDE ers 이 QE QUO a e lo venetia le în vă 29d 
. Program $i subprograme FORTRAN privind testele exacte de normalitate in 2. Compararea puterilor $ k doll 
prezenţa parametrilor necunoscuţi `. . : sia bată CA 2 3 I v 2.1. Compararea testelor w2, “Aa, daia și E prin in transforma ca ten 
iniţiale în variabile SRN 12.3.1) sau în variabile mite 7 (teore: ant 
Capitolul 13. Observaţii pe eere . ........ e URL atu CEA PEN 275 12.3.5) 4 quu WE ien: 
1. Introducere . . ze ee spen cina ambala A; 으시 고 pă IE ao e mo 2.9. Compa و‎ testeo Ws A2cu testele D. m, ul, Y. si nee 
e cud um 7 cr P E ج سل‎ sea died certe: MM pet iac cu testa 
4. Statistici pentru verificarea unor ipoteze privind observaţiile pe cerc... 건 EX. Comparares b ur a 337 
4. S N 278 bazat pe statistica b, . . T T S (19:330) (19.3.2) 
E tatística E AS ET O 군서 da 2.5. Compararea testelor Bază ta. pe statisticile 15 و‎ şi ۰ , 338 
A A 이이 E e ds Ta v M TES 279 si (19.3.5)) cu tekal pile pr aii T bı Ae 341 
3, Suprafefe sensibile stilizate . . 3 Dah کی‎ vous dni is rd 
Capitolul 14. Teste de tip Shapiro . git et ay he ig ی‎ E ON UNE RA eL SR M A MP 
1. Introducere . . SS 아시 LILIA ARA Tabele e و‎ ESAS, soos E 
2, Testul Shapiro —Wilk (1965) pentru normalitate. jÎ t^ یی‎ Tae j oed eso să Mae AND a en aL Ee 362 
3. Testul Shapiro—Hahn (1967) pentru exponentialitate . . . . . . . . . - . 291 A neză M tea! A EST aaa 364 
4. Testul Shapiro—Wilk (1972) pentru exponentialitate . . Lo Aa a 293 Bibliografie ats PRE UI ee mite E E O c a ăla E E late 
5. Testul Shapiro—Francia (1972) . . ERO LA roy PA 
6.. Program și subprogram FORTRAN privind testul Shapiro—W ilk e os 
Capitolul 15. Testul D'Agostino GUI O LU sedare Qe i ORE RD 300 
a IE DIE RED PI ارس را‎ es ug duin iss e NOS DM 
اب‎ eR a 
3,. Testul D'Agostino i E De o HINE Ce SN 
4, Subprogram FORTRAN pentru “statistica D'A gostino . =. II 
Gapitolul 16. Teste de independenţă și verificarea nare velar 아사 해 
1. Introducere . . ماه و‎ EL ER so re 
2. Testul celei mai lungi iterații (testul Ty Susie hed Ade bt LER en RA 307 
3. Testul numărului de iterații (R) . . . , , ~ TORE ¿ESOS 
Capitolul 17. Coeticienfil pearsonieni şi verificarea normalității is oreo. TT 314 
1. Introducere . . ciel rato 311 
2. Coeficientii B, si B, pentru unele repartitii alternative celei normale. ALE 313 
3. Teste de normalitate bazate pe statisticile Da Bi Dam eee lS a că Ree 
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CAPITOLUL? 


TESTUL X? 


1. Introducere 


Statistica X? clasică se foloseşte pentru a verifica ipoteza nulă 
H, conform căreia frecvențele observate m, Mg, ..., n, în k clase 
sau celule au o repartiție multinomială cu probabilitățile p,, Pa, 
, P Specilicate. Frecvența teoretică a clasei 4 este np, unde n = 
k 


y ha. 


În scopul verificării ipotezei H, Karl Pearson introduce statis- 
k 


2 


tica X? — y (n; — np)*/mp;. Testul clasic al lui Pearson-Fisher 
i=l 

respinge ipoteza H, dacă valoarea statisticii X? depăşeşte cuantila 

de ordin 1 — « (« pragul de semnificație al testului) a variabilei 

Ak — 1). 

De îndată ce frecvențele teoretice devin mici, aproximatia re- 
partiției lui X? prin repartiția y? nu mai este corespunzătoare si 
aceasta se intimpla deoarece aproximatia y? a fost obţinută ca limită 
a repartitiei adevărate cînd 21, Pz, ..., p, rámin fixate pentru n > oo, 
astfel încît np; > co. După unii autori, aproximatia este satisfăcătoare 
numai cînd frecvențele teoretice sint cel putin 5 (Fisher (1925)) sau 
10 (Cramer (1946)), sau 20 (Kendall (1952)) sau în cazul verificării 
normalitátii, la un prag de semnificaţie « = 0,05, una singură in 
jur de 0,5 si celelalte deasupra limitelor convenţionale de 5 sau 10 
(Cochran (1952)). Putem folosi următoarea regulă : 

„Dacă numărul claselor este k > 3 si dacă notăm prin 5 numărul 
frecvențelor teoretice 5, atunci frecventa teoretică minimă poate 
fi n ۰ 

Se poate încerca o rezolvare a problemei frecvenţelor mici cu 
ajutorul aproximatiei C(m). În această aproximaţie, obţinută prima 
data de Cochran (1942), se presupune că pentru n > oo, unele valori 
medii rămîn finite în timp ce altele sînt oo. Aproximatia O(m) poate 
fi folosită cu succes numai dacă sînt disponibile tabele cu punctele 
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percentilice ale repartitiei O(m) sau un program de calcul pentru 
generarea repartitiei C(m). 

În practică se intilneste problema verificării unei ipoteze nule 
compuse conform căreia observaţiile provin dintr-o familie de repar- 
titii F (2, 0). Pentru a găsi frecvențele teoretice ale celulelor trebuie 
sá se estimeze parametrul ۰ 

Dacă pentru a estima, parametrul 0 se folosește metoda verosimi- 
litátii maxime sau orice altă metodă asimptotic echivalentă, testul 
rezultat este testul Pearson. 

Dacă în loc de estimatorii de verosimilitate maximă bazati pe 
datele originale se folosesc alti estimatori, X? rezultat (Chernoti- 
Lehmann (1954)) nu mai are la limită, în ipoteza nulă, o repartiție 
y2. Oeeace este mai delicat este faptul că repartiţia în ipoteza nulă 
depinde de valoarea adevărată (necunoscută) a lui 0. 

Această situaţie nedorită conduce la folosirea celulelor ale căror 
margini sînt ele insile funcţii de date. Vom numi aceste celule, celule 
aleatoare. Watson (1959) si Roy (1956) studiază versiunea aleatoare 
în testul X? al lui Chernoff-Lehmann şi găsesc că dacă F(a, 0) este 
o familie locatie-scali, atunci repartiţia limită în ipoteza nulă, nu 
depinde de valoarea adevărată a lui 0. Witting (1959) studiază cazul 
in care marginile celulelor sînt cuantilele de selecție și generalizările 
multidimensionale. 


Cazul unidimensional al testului X? cu celule aleatoare a mai fost 
cercetat de Dahiya, Gurland (1972) şi de Bofinger (1973). 

Găsirea, repartitiei asimptotice în cazul celulelor aleatoare este 
dificilă. Tehnica esenţială este de a arăta că diferenţa dintre statistica 
cu celule aleatoare şi cea cu celule fixe de formă similară tinde la zero, 
în probabilitate, cînd volumul selecţiei creşte (Roy (1956)). Chibisov 
(1971) obţine repartitiile limită ale statisticilor Pearson-Fisher şi 
Chernoff-Lehmann în cazul celulelor aleatoare în ipoteza nulă 81 de 
asemeni în şiruri de alternative Pitman. Dacă observaţiile sînt k-di- 
mensionale se folosesc rezultatele privind convergenta slabă a pro- 
cesului empiric în R*. Moore ((1970), (1971)) găsește repartiţia limită 
a acestor teste cu celule aleatoare pentru celule rectangulare în ۰ 
Chase (1972) studiază statisticile X? de tip Pearson-Fisher şi Chernoff- 
Lehmann cînd estimatorul 0 a fost obţinut dintr-o selecţie indepen- 
dentă de selecţia pe care se bazează testul de ajustare. Murty gi 
Gafarian (1970) studiază aceleaşi teste cînd estimatorul este bazat 
atit pe selecția folosită pentru testul de ajustare cit şi pe o selecţie 
independentă. Chase, Murty si Gafarian studiază numai teste bazate 
pe celule fixe si obţin repartiţia limită numai în ipoteza nulă. Moore 
şi Spruill (1975), apoi Moore (1971), dau pentru 0 clasă generală de 
statistici X2 repartiţia pentru selecţii de volum mare. De asemenea 
studiază cazul cînd F(a, 0) nu este continuă in z, in particular cazul 
în care mulțimea discontinuităţilor este cunoscută şi fixată. Aplica- 
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bilitatea metodei este limitată din cauză că diferența dintre statistica 
Shia p 81 statistica cu celule fixe converge in probabilitate 
Malikovich si Afifi (1973) folosind versiunea multidimensi 
transformării Durbin sau Stórmer- Sarkadi verifică یی‎ be 
multidimensională cu ajutorul  testului X2.. Aceeaşi problemă se 
rezolvă folosind standardizarea variabilelor, caz în care repartiţia, 
limită depinde de marginile claselor, însă nu depinde de parametrii 
necunoscuţi. În cazul în care se aplică testul X? la datele originare 
repartiția limită depinde atît de marginile claselor cit 81 de parametrii 


necunoscuţi, însă efectul acestei de 
a ی ی‎ pendente este moderat dacă nu- 


Popoviciu (1978, 1980) și Văduva (1980) înlocuiesc ifi 
povi 97 verificarea, 
normalitátii multidimensionale prin verificarea fa i i 
forma pătratică este repartizath x". ae pati o aa 


2. Statistica X°. Aproximatia y? 


Fie X o variabilă aleatoare. avînd funcţia de re iti 
۳ . و‎ vari i partiție; 2 
E, k mulțimi disjuncte ce realizează o partiție a axei رز‎ si 
j —1,...,k, probabilitatea ca variabila X si ia valori in mulțimea, 


k 
5 رز‎ Ps HA]: 
1 
Dacă luăm intervalul [a,, 4,41) dreptímultimea E,, atunci 
Dy = Fay), — Fla): 


_ Teorema 2.1. Probabilitatea ca tntr- 
variabilei aleatoare 그, n, valori de selsoj 
j= 1,2, ..., و‎ 6 


o selectie de volum n asupra 
te să aparțină mulțimii E,, 


a AR e DA ră uan SET 
12? '"2) x x) mint... My! PP ۰۰۰ D 


k 
unde Y n, = ۰ 


1 
Demonstrajie. Vom demonstra teorema prin inducti 
: om. fie agn 
lui k. Pentru k = 2 gi orice întreg n >0, ras tg pon 


P(n nals WP pipe, 


tormulă cunoscută de la repartiţia binomială. Presupun 
3 em că aceast 
formulă este adevărată pentru k < 4 şi orice ete a >0. s 
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Avem : 


ha ..., Racu ha) = (probabilitatea ca E, să se realizeze‏ وا 
determinări,‏ رس in n», determinări) (probabilitatea ca in cele‏ 
(Eii<i<a-1 SÁ se realizeze de n, ori)‏ 


si, tinind seama de ipoteza de independenţă, 


D (5 2 y 
P,(m, Mas +++) 44, ña) = - 


^" r 
"o — Dat Pa n (My May > + y ha) 
n,l(n — n) H 
| 
AA. A. Ma iret ۳4 y in — ha)! 


- — PUDE a put, 
Ny eg wings! T : 
‘ceea ce demonstrează teorema. 

Definitia 2.1. Vectorul (ni, Mz, ..., n;) care are functia 
vente (2.1), se numește vector multinomial. 

Propoziția 2.1. Pentru functia de freevente (2.1) avem 


Mong - wp 7 = LGA SR 


de frec- 


M(nj) = n?pj + )ره‎ — py), M(nn,) = n(n — 1)pp,, 


M(nj) = mpi + 3n*px(1 — pj) + 1)رمه‎ — p, — 2p,), 
M(nin,) = n> pip, + npp — 3p,) — npyp,(1 — 2p,), 
M(nnjn,) —1)\(n — 


M(nj) = 


= n(n APDIP 1 AJ AL=1, 2,...,k 
np; + 1 


= pyú — 


— py) + ۸02021 = ۲)(وم‎ = 11p,) — 


— 1 2p, — 2 pj), 


M(njn,) = n*pip, + 3n?pqp,(pi + p, — 9 p2) + 


+ n?p,p,(1 — 9p, — 9p, + 11p?) - 


»p;p; (1 6p; — 6p 072), 
M(ninj) = Wpip; + n?pqp,(pi + p, — 6 pp) 4 
+ n*pp(1—3p, — 3p, + 11pp,)—npp,(1 2p, — 2p, + OPP), 
M(njnjn,) = n'pip;p, + n3p pp (1 — 6p,) — 
- ""pp,p(3 — 112.) + 2p,p,p (1 — 3p,), 


MNN; N nn) = n(n — 1)(n —2)n—3)pp;pipa- 


Propozitia 2.2. Pentru functia de frecvente (2.1), avem 
P(t, te, - 


1 Yi it, 
زیر و‎ n) = (pes + p,e" + + p,e t)”. 


9 0 
Sone 


l'oerema Asimptotic, pentru n si n, 1 <1 <k, suficienti 
mari, are loc dezvoltarea 


1 


Ny) IE (27m) 1-0/28 2‏ و۰ 


XT. 
Pn, Noy ۰ 트기 


unde 


k 


ro E (n — np,)? 
2,3) pvo Y Juni | i 
np; 


Demonstrahe. Tinind seama de formula lui Stirling 


yore 0 ۱ ۱ 
n!=\V2rnn"e-"e*, |0۱ > 1/12 n, 
SAU 
ni~ 1220 nes, 
obținem 
py ¿RN k 
; V2rn me AA 
Pr (Mi, hog, ..., (2 سس‎ II»; ru 


ss / - 1 
(020 pp mit eT": 
1 
(2.4) 


1 npi not 1/2 
I) 


t= Mi 


^ 
(27) *-D/29/(*-D/2 II» 


D 


1 


1 


/.4) au semnificațiile : 
2, — numărul valorilor de selecţie care aparţin mulţimii Æ, 
np, — valoarea medie a variabilei aleatoare n,. 
Variabila redusă 7, corespunzătoare variabilei n, este 

m NL —M(n,) lis Mi MN 

D(n,) o; 


- 1 npg; 
), relația (2.4) devine 


T 154 
2.6) à 


2 ar E, - 
(2x)* -U/24*-0/2 I pi" J 


de 


Din propozitia 2.1 rezulta ca factorii din membrul drept al relatiei 


si 


21 


de unde 


A 
In U = — Y (10 + np +) (i "E 
1 2 np, 


Pentru toti n, pentru care |i,o,/np,| < 1, seria de puteri 


in (1 + tet) roe cep bod Ed a | x 
Vp, "p,. 2 Amp; 3 (np, 
este convergentă. Obtinem : 


A $ A T. — YN تب‎ 
ln U=-— Y t, Vipa; — — oo (nu = impo? + 0(1//m). 
1 2.5 NDP; 
Dacă ţinem seama că : 


k A 

* tV npt = Y (Mm — np) = 0, 
1 1 

teorema este demonstrată, 

Dacă np, sint suficient de mari, (2.2) este o aproximaţie bună 
pentru P,(m, Noy و۰۰‎ n4). 

Observație. Dacă aproximatia (2.2) este aplicabilă, vectorul 
aleator (n, Mz, ..., Ny) are o probabilitate de realizare mai mică dacă 
X* (dat de (2.3)) este mare, şi are probabilitate mai mare dacă X? 
este mic. X? este mic dacă gi numai dacă toate valorile variabilelor n, 
sint apropiate de valorile lor medii np,. 

Prin urmare, statistica; X? este un bun indicator dacă sau nu 
toate variabilele », iau valori apropiate de valorile lor medii gi, in 
acelaşi timp, dacă acestea au probabilitatea, de realizare mai mare 
sau mai mică. 

Pentru n dat, X? este o variabilă aleatoare discretă, unidimen- 
sională. Mulțimea tuturor valorilor posibile ale variabilei X? se 
obţine facind pe M, Ag, ... , Ny SÁ parcurgă toti întregii nenegativi, 


astfel incit Y n, = n. 
1 
Pentru n dat, repartiţia variabilei X2 este complicată pentru a 
putea fi folosită in practică, exeeptind valorile mari ale lui k si » 


eînd aceasta poate fi determinată explicit. 
Teorema 2.3. (Fisher (1922)). Avem 


(2.7) lim P(X? < 0) = P[y Ak — 1) < c], e >0. 

CGbservatie. Calcule numerice arată că membrul drept al relaţiei 
(2.7) este o aproximație bună pentru P(X? < 0) îndată ce np, > 10 
pentru toţi j. 
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Definifia 2.2. Aproximarea probabilității P(X? > 0) prin pro- 
babilitatea P( yk — 1) 2 c) se numește aproximatia y?. | 

Folosind funcţia generatoare de momente a repartitiei multi- 
nominale, obtinem 

Teorema 2.4. (Hoel (1938)). Are loc aproximarea 


(2.8) P(X? < e) = P[yAk — 1) > o] + n RS, + R48,), 


unde 


k 
(2.9) و8‎ = | Hor — + 2 2) |, 
T 
۱ ee ee gee 
(2.10) و‎ = 5, | Ese - Gn + 06 4 | 
2414 


și pentru k impar 


1 1 

T (k-1) r 

C e 

9.11 sir k +11, 
ED ٩ 0 0 가 


그 (8-1) Lp 

2 2 

Cc e ۱ 
Es * — 2(k + 3) k + 3) (k + 1)], 
2 2.4... (k +1) (k + 3) [e (k + 3)e + (k + 3) (k + 1)] 


(2.12) 
in timp ce pentru k par 
> 61 er 


A ON Si" e. es T 
$ "a oi (k + 1)] 


۳ ule + 6-0 + 
r,=|/2. 도배 E NTS Ga e A 
T 1.3... (Ek جد‎ 1) (k + 3) 


(2.14) 
x [c? — 2 (k + 3) e + (k + 3) (k + 1)]. 


3, X”-statisticá test pentru verificarea unei ipoteze simple 


Ne propunem să verificăm ipoteza H conform căreia probabi- 
litatile P(E,), 1 < j < k, au valori numerice definite : 


P(E,) = po pentru 1 <j « k. 
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Se efectuează o selecţie de volum n si fie n, numărul de realizări 
ale evenimentului E, în această selecţie, adică frecvența observată, 
a acestui eveniment. În scopul verificării ipotezei H vom compara 
frecvențele observate n, cu frecvențele teoretice pe care nu le cunoas- 
tem însă pe care le putem determina multiplicind fiecare probabi- 
litate po, prin n. Pentru luarea deciziei folosim statistica X? dată de 
(2.3) si respingem ipoteza H dacă 


(3.1) docs Ue dy 


Observaţie. Pentru ușurința calculelor, in locul statisticii (2.3) 
se foloseşte statistica 
n; 
Poi 
cu toate că (2.3) prezintă avantajul că este funcţie directă de dife- 
rentele dintre frecvențele observate si mediile lor ipotetice mp; 
diferente care prin ele insele sint importante. 

Nu este lipsită de interes cunoașterea momentelor statisticii X2. 

Presupunem că în ipoteza H, probabilitățile ipotetice sînt 
Poi Și că X? este dat de (3.2). Ne vom mărgini numai la ipoteze simple. 
Presupunem că probabilitățile adevărate sint pu € = 1, 2,..., k. 
Valoarea medie a statisticii test este 


1 
(3.2) AA = — X — n, 
n 


N 1 9006 ۲ 
M(X’) =— Y — Mm) — n 
nier Da 


şi, tinind seama de propoziţia 2.1, obţinem 


k » (1 — p, kou. 
(3.3) M(X?) = y pi -— Pu) +0 |x pu — 1| { 
1 Pos 1 Poi 
Daca este adevărată ipoteza Ho, relaţia (3.3) devine 
(3.4) Mya, (X?) = k — 1. 


Acest rezultat era de aşteptat, deoarece, asimptotic, X? era repartizat; 
yk — 1), (teorema 2.3). 

M(X?) dată de relaţia (3.3) are valoarea minimă cînd Ppi: = Por 
Pentru orice ipoteză H, specificind o mulţime de probabilitati p,, 4 
Z pg; Şi pentru orice volum al selecţiei, avem 


(3.5) My CX?) > k —1, 
ceea ce arată că regiunea critică pentru testul X? constă in 


coada superioară, deşi această indicație nu este concludentá deoarece 
repartiția asimptotică a statisticii .Y?, cînd este adevărată ipo- 
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vo 


teza H,, nu este un y”. Repartiția statisticii X? in ipoteza alter- 
nativa este dificil de evaluat, chiar asimptotic, exceptind cazul 
anumitor presupuneri suplimentare. 


수 رید‎ us 1 ㆍ . 
In cazul probabilităților egale pp,=—, asimptotic, avem 


2, CX?) = 2(k — 1) 
Di CX?) = 4(m — LY pi, — (X P1? 


(3.6) 
81 (3.3) devine 
(3.7) My (X?) = (k — 1) + (n — 1) (k Y pi; — 1). 


4, X -statisticá pentru verificarea unei ipoteze compuse 


În $ 3 s-a prezentat o metodă pentru veriticarea concordantei 
dintre o repartiție empirică si o repartiție ipotetică pentru care 
1011 parametrii erau daţi numeric, adică cazul unei ipoteze simple. 
Adeseori trebuie să verificăm ipoteze mai generale (compuse) conform 
cărora o mulțime de observaţii este o selecţie asupra unei variabile 
ce are o repartiție de un tip dat, dar o parte sau toţi parametrii ce 
determina această repartiție sint necunoscuţi (cazul ipotezei nespeci- 
l'icate). 

În astfel de cazuri, parametrii necunoscuţi sint estimati cu aju- 
torul datelor de selectie, estimatiile astfel obtinute sint introduse in 
repartiția de tipul dat, repartitie ce devine complet specificată, apoi 
este verificată concordanța. Se pun următoarele întrebări : 

— ce metodă de estimare folosim ? 

— ce modificări trebuie aduse testului de concordanţă discutat 
în § 3? 

Presupunem că probabilitățile teoretice po; sint funcţii de 
s(s <k— 1) parametri necunoscuţi 0,, 0, ..., 0, si vom serie 
2061.00). Dacă t este vectorul estimator al vectorului 9=(0,, 0,, ...,0,), 
(2.3.) se serie sub forma 
D — npo. 


k 
X2 = y 
1 npu(t) 
Deoarece py(t) sint variabile aleatoare, urmează că repartiţia asimp- 
totică a statisticii X? nu va mai avea aceeaşi formă ca în cazul ipo- 


tezei simple Hy. Termenul n; — npou(t) nu va mai avea valoarea 
medie 0 şi X? se poate 80116 


ET Y 
X? = ri Me as 오우 Lg (t) ]? 4. n? eoa : 0)? — 
2 ET (ne — npor(t)] [2000 — Poi(0)] 


(4.1) 
— 2n[n, — wpa(8)][po(t) — Pou(0)]). 


Cum asimptotic, 


N; — و90‎ ~ ent, 
urmează că [n; — npg(0)]? este de ordinul n. Dacă avem 
(4.2) Pailt) — Poi(0) = 0(n-1/?). 


al doilea si al treilea termen din (4.1) vor avea ordinul mai mic decit m 
si relativ neglijabil, astfel că asimptotic (4.1) se va comporta ca primul 
termen. 

La numitorul relaţiei (4.1) variabila aleatoare npo(t), poate fi 
înlocuită la acelaşi ordin de aproximaţie, cu 26,(0). 

Așadar, dacă (4.2) are loc, (3.2) se comportă asimptotic ca (2.3), 
adică are o repartiție y? (k — 1). Totuşi, dacă py(t) sînt funcţii de t, 
atunci ele vor diferi de (0)بوم‎ cu același ordin de mărime ca t de 0, 
şi deci relaţia (4.2) cere ca 


(4.3) t — 0 = 0(n-12). 


Deoarece, obişnuit, avem estimatori cu dispersiile si covariantele 
de ordinul n-}, 


(4.4) t — 0 = 0(n-Y2) 


şi (4.3) nu este satisfăcută. 

Presupunem cá are loc relaţia (4.4) gi să alegem ¡ca mulţime 
de estimatori pentru 0 estimatorii de verosimilitate maximă sau orice 
alti estimatori echivalenți asimptotic astfel 14016 t = 6. În acest caz 
functia de verosimilitate este dată de (2.1) privită ca funcţie de 6, 
(de care depinde py). Astfel, 


(4.5) 


şi estimatorii de verosimilitate maximă multinomiali sint cele s 
rădăcini ale ecuaţiilor obținute egalind (4.5) cu zero pentru fiecare 7. 

Fiecare dintre aceste ecuaţii este o relaţie liniară omogenă în 
n,. In acest caz se impun procesului de estimatie al parametrului 
6 încă s legături liniare, astfel încît, statistica. (3.2) este repartizată 
asimptotic x2(k — s — 1). 

Efectul estimării parametrilor necunoscuţi asupra repartitiei 
asimptotice a statisticii X? a fost studiat, de Watson (1959) şi reluat 
de Kendall şi Stuart (1961). 

Teorema 4.1. Dacă t — 0 = 0,(n71/2), atunct 28 ~ Uk + و‎ — 1). 

Observatii. i) Fisher (1928) studiază efectul folosirii altor esti- 
matori pentru 0 asupra repartitiei asimptotice a statisticii X2. 
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ii) Chernoff, Lehmann (1954) au arătat că dacă sînt folositi 
estimatorii de verosimilitate maximă bazati pe n observaţii indivi- 
duale $i nu estimatori de verosimilitate maximă multinomiali bazati 
pe k frecvențe m, X? obţinut nu mai este asimptotic repartizat ¥. 

iii) Totuşi, funcția de repartiție a statisticii X? este cuprinsă 
intre funcţiile de repartiție corespunzătoare variabilelor y*(k — 1) 
pi x(k —s —1). Pentru- selecţii de volum mici folosirea, repartitiei 
x'(k — s — 1) pentru verificarea ipotezelor conduce la erori grave. 


5. Proprietăţi ale testului X^ 


Definiția 5.1. Vom spune că un test pentru verificarea ipotezei 
H, fata de alternativa H, este consistent dacă 


lim Pg,(x € W) =1 


unde W este regiunea critică, x este vectorul avînd drept componente 
variabilele de selecţie şi » volumul selecţiei. 


Teorema 5.1. Testul X? cu probabilitájt egale este consistent. 


Definifia 5.2. Vom spune că un test pentru verificarea ipotezei 
H, fata de alternativa H, este nedeplasat dacă 


Py, (ve W) >a, 


unde « este pragul de semnificaţie al testului, 


Teorema 5.2. (Mann, Wald (1942)) Testul X? cu 8 
egale este local nedeplasat. 


Un rezultat mai puternic aratá că testul X? cu probabilitati 
egale este uniform nedeplasat față de toate alternativele. 


Mai intii observăm cá în cazul probabilităților egale (» = i) 
(3.1) se scrie 
(5.1)3 y n? > Pis + x: (k — 1)) = c (notație) 
şi deci regiunea critică este 


k 
(5.2) W, = (n =: (fh, Mey ㆍ Me), fh > و0‎ y; m =, > ۸07 > o) 
1 


m 


Teorema 5.3. Pentru orice e, pu Pa, ۰۰۰ Pr 20, Y, p, = 1, 


ni 1 بل‎ n! 
۳ pip US p, > - y — = a 
he 


(5.3) 
EW, Ny! > k* «EW, Mal... my! 
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În afară de cazurile 


] x i 
i) P; = —., Sau ll) .6 < Cap DN? 


cu 


k 
(2: min ^B d 
y 1 


CA OS =8 
(8, My pd و‎ 2} 


avem inegalitate strictă. 

Vom demonstra teorema pentru k = 2, cazul general demonstrin- 
du-se prin inducţie (Bimal Kumar Sinha (1976)). 

Dacă e < Cno > 1”, membrul sting din (5.3) este 0 sau 1 inde- 
pendent de n = (n, na} si deci (5.3) devine o egalitate. Prin urmare 
presupunem 6,5 < € < n? 81 21, Da > 0. Notăm că nu este nimic de 


1 
demonstrat dacă are loc i) sau ii). Deci vom presupune că p, + = 
br 
816,9 se < an? Dacă punem n, = 2 gi n, = n — x, membrul sting 
din (5.3) devine 
(5.3) رز‎ Capi — ۶ 


neW, 
cu regiunea critică W, dată de 


fæ: a? + (n — oe 


5 225) 
3 n* (n* +1 
Cum Cy. este 5i [28 


py ےه‎ 


۱ pentru n par (impar), (5.3’) se scrie 


n ] 
2 | 


expresie care nu este egală cu 1 independent de p,. Dacă rescriem 
5.3 


(5.3%) Y Cipi(l — ۳+ Y, Cupid — pr < | 
za? 


222-?『 


(5.3) în forma 
1 1 
a (21 —2 ide. ) 2۳01 - (۳ 7 de 
(5.4) \ —— - + ~ = 
J Br +1, » — v) B(r + 1, n — r) 
1-5 P1 
pe Care o vom nota prin f(p,) găsim că f(p,) are un minim unie 
i nme AS : 1 at, om 
in p, = — şi deci (5.3) are loc cu inegalitate strictă în afară de cazul 
1 ^ - 
1 
MIS 
2 
28 


Teorema 5.4. (Eisenhart (1938)) Dacă pi; — pg; = en 2, unde 
sint fixati, atuna X? ~ y?* (k — $ — 1, X) cu 


^ 


ci * (Pas — Poi)? 
x i =H" ۷ 14 Qi 4 


"c LINGE y e 
i=1 Poi i=l Poi 

cei s estimatori fiind estimatorii de verosimilitate maxima multinomi- 
ali 


(5.5) a= 


6. Alegerea claselor pentru testul X’ 


Mai întii considerăm problema determinării marginilor claselor, 
lăsind la urmá problema numărului de clase k in care observaţiile 
sînt grupate. Dacă problema impune o discretizare naturală sau dacă 
vvem o selecţie asupra unei variabile discrete, problema determinării 
marginilor claselor apare numai în sensul in care trebuie să decidem 
(pentru a micşora k sau pentru a mări acurateţea repartitiei asimpto- 
tice a statisticii X?) atribuirea unor frecvente ipotetice în punctele 
discrete. Însă problema determinării marginilor claselor apare cu 
stringenta în cazul selectiilor asupra variabilelor continui. Dacă pre- 
supunem că X a fost determinat într-un anumit mod, cum vom deter- 
mina, marginile claselor ? 

In practică se foloseste următoarea soluţie : clasele se aleg astfel 
încît să acopere domenii egale ale variabilei, exceptind extremele in 
care domeniul variabilei este infinit. Mărimea clasei este determinată 
de dispersia repartitiei, în timp ce locaţia (poziţia) repartitiei ajută 
la stabilirea centrului clasei. Asttel dacă am dori să formám zece clase 
pentru verificarea normalitátii, luăm ca margini ale claselor valorile 


intervalele extreme fiind 
(—co, Y 28) şi (X + 28, co). 


"n 
* Repartiția 4? necentratá este repartiția variabilei aleatoare Y (U; 


1 
1 


Uj, 1 < j <n sint variabile aleatoare independente si identic repartizate N(0,1) si 34, 


5,;)? unde 


1 
| < J < n sint constante, Se notează x*(n, A) unde A= y 82 si are densitatea 
auras 


8 


1 LI 
exp میم‎ s EA) 3 Te 


T 

22/2 =0 "m 
d 8 n+ j F231 j! 

9 


i 


j 
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Acest procedeu nu este precis, face marginile claselor variabile 
aleatoare 81 nu este evident că repartiţia asimptotică a statisticii 
X? calculată, cu clase formate în acest mod este aceeași ca repartiţia, 
obţinută în cazul în care clasele sînt fixate dinainte. Totuşi, deoarece 
teoria asimptotică are loc pentru orice mulțime de k clase fixate, ea 
va avea loc de asemenea cînd marginile claselor sînt determinate din 
selecție în orice mod. Watson (1957) (cazul normal), Roy (1956) şi 
Watson ((1958), (1959)) (cazul general al repartitiilor continui) con- 
firmă acest fapt cînd marginile claselor sînt determinate cu ajutorul 
estimafiilor regulate ale parametrilor necunoscuţi. 

Mann, Wald (1942) și Gumbel (1943) aleg k astfel încît probabi- 
litátile ipotetice po, sînt toate egale cu 1/k. Acest procedeu este perfect 
definit si unie. Pentru a fi exact trebuie ca datele să nu fie grupate. 

Vessereau (1958) comparind repartiția statisticii X? cu repartiţia, 
limită 4*(k — 1) pentru p, = = şi valori mici ale lui » (între 15 şi 20), 

8 
stabileşte că putem folosi repartiţia limită a statisticii X? fără a face 
o greşeală prea mare, la pragul de semnificaţie « = 0,05 sau « = 
=0,01, chiar dacă. n, — 1, Ji 1, و2‎ ..., k. 
În cazul probabilităților egale, cu ajutorul teoremei 5.4 putem 


da o indicație privind alegerea lui k. În acest caz parametrul de 
necentricitate este 


k 
(6.1) A= nk 0, 0, =p, ——. 
۷ i 1 adi sd Ju d y 7 
Presupunem că |6,| < ۳۹ pentru toti + şi considerăm cá k devine 
k 
mare. Atunci 0 = Y 0; ca funcție de k va fi de acelaşi ordin de 


t=1 


xs J U E wd TI 
mărime ca suma pătratelor in intervalul ( ae ait adică 


lk 1/k 
(6.2) 0 ~ a u? du = 2a | u? du. 
—1/k 0 


Puterea asimptotică a testului este funcţia r(k, A) sau același lucru 
mik, Mk)); puterea este o funcţie monoton crescătoare de A şi obti- 


۱ k) A . 

nem punctele staţionare din OMNE = 0. Din (6.1) şi (6.2) avem 
3 y 2 1 

"RR Bs +24 (7) [^5] — 8 — 2ak-?, 
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de unde 


(6.3) k- ~ 0/(2a). 


Pentru valori mari ale lui k, repartiția statisticii X? (atît în ipoteza 
H, cit şi în ipoteza H,) tinde către repartiția normală si prin urmare 
funcția de putere asimptotică a testului este 


놀 


۳ arx | | 
> 06 5 
(6.4) an cq [DX X*]H;) pr 0 Us], 


unde 

(6.5) D(—u) = a 

determina volumul testului. Din (3.6) si (3.7) 

(6.6) |5 | m| AT 
00 0-0 

(6.7) D2(X2| Ho) = 2(k — 1), 


şi dacă ţinem seama, de aceste valori gi de (6.3) obţinem că puterea, 
asimptotică maximă este 
(6.8) r = {a(n — 1)k-5/2 — ua). 
Dacă zx, este valoarea maximă pe care o dorim, inversind (6.8) 
obţinem 
(6.9) D-ro) = 2U*a(» — 1)k-5/2 — up. 
de unde 
21/2) — 1) 5 ۰ i 
(6.30)0 =D QW SEA (Kendall, Stuart (1961)) 
Ue T D-X xp) 
Gu dires gS: 
: سر‎ 1 1 1 5 ve 
Observaţii. i) Cind xy = pal! p-1 fi = 0 şi (6.10) se simplifică. 
a 
În acest caz, Mann, Wald (1942) obţin (6.10) printr-un raţionament 
a ۰ ? ۰ y ? A . 7 ۳ ۰ NA 
mai riguros; ei găsesc, in eazul ipotezei simple, b = 4. ii) În cazul 
probabilităților egale, k va creşte proportional cu n? şi k va fi mai 
mic în situaţia în care sîntem interesaţi de regiunea cu putere înaltă 
decît in situaţia în care sîntem interesaţi de regiunea de putere joasă 
(cînd $-!(z,) se apropie de وبا‎ prin valori mai mari deoarece testul 
este local nedeplasat). 
Cub = 4 şi x, pc (6.10) conduce la valori ale lui k mult mai 


mari decit cele folosite obișnuit. Cind n = 200, k = لو‎ pentru 
a = 0,05 si k = 27 pentru a = 0,01 : acestea sînt cele mai mici valori 
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ale lui k pentru care aproximatia normală folosită are acuratețe. În 
acest caz, Mann, Wald recomandă folosirea lui (6.10) cind n > 450 
pentru « = 0,05 şi n > 300 pentru « = 0,01 ㆍ n], media ipotetică 
în fiecare clasă, creşte ca n%5 şi este egală cu 6(8) cind n = 200, « = 
= 0,05 (a = 0,01). ۱ 

Exemplul 6.1. Kendall, Stuart (1961) consideră primele 50 de 
statistici de ordine ale unei selecţii de volum 1000 considerată de 
Quenoille (1959) în scopul verificării ipotezei H, conform căreia 
aceste observaţii provin dintr-o populaţie caracterizată de 

dF = exp(—a)dz, 0 < x < oo. 

Aceste statistici de ordine sint : 
0,01; 0,01; 0,04; 0,17; 0,18; 0,22; 0,22; 0,25; 0,25; 0,29; 0,42; 
0,46; 0,47; 0,47; 0,56; 0,59; 0,67; 0,68; 0,70; 0,72; 0,76; 0,78 ; 
0,83; 0,85; 0,87; 0,93; 1,00; 1,01; 1,01; 1,02; 1,03; 1,05; 1:825 
1,34; 1,37; 1,47; 1,50; 1,52; 1,54; 1,59; 1,71; 1,90; 2,10; 2,85; 
UA 2,46 : 2,46 : 2,50; 3,73; 4,07 ; 6,03. 

a) Presupunem că dorim să formăm patru clase pentru testul X?. 
O grupare naturală cu intervale egale va fi 


RE i ADE AA OR a A E N RE MU OMM E 
intervalni Frecventele Frecventele 
observate (ni) ipotetice (mpi) 


A -->  —_— ا‎ 


(0—0, 50] 14 | 19,7 
(0, 50—1, 00] | 13 | 11,9 
(1,00—1, 50] | 10 | 7,2 
(1,50 si mai mult) | 13 | 14.2 
| 50 | 50,0 
Avem 
9,50 
Pı = | dE (ax) pon ] — e- 05 = 1 مم‎ 0,60653 sei 0,39347 ; 
0 
1,00 
وم‎ = A dF(a) = e-95 — e-r — 0,60653 — 0,36788 = 0,23865, 
0,50 
1,50 
و‎ = | dF(z) -— e700 — 6 89 — 0,36788 = 0,22313 = 0,14475, 
1,00 
oo 
p= dF (a) = e71" = 0,221313. 
1,50 
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Găsim X? = 3,1 gi la trei grade de libertate nu vom! respinge ipoteza 
IT, pentru orice test de volum mai mic decit a = 0,37. 

b) Rezolvăm aceeași problemă însă presupunem că dorim să 
formám patru clase avînd probabilitáti egale. În acest scop găsim 
valorile celor trei cuantile 01, Q4 8i Qs. Obtinem 

01 
Pı =| dF(z) = 1 — ۵9: = 0,25, 
0 


de unde Q, = 0,288; 


Ds =| dP(z) = e-09: — e7% = ۵-0288 — 6-0 = 0,25, 
Q 


Qs 
de unde Q, = 1,386. 
Formăm tabelul 
ig Frecvente Frecvente 
Intervalul | observate ipotetice 
(0—0, 28] | 9 | 12,5 
(0, 28—0, 69] | 9 12,5 
(0, 69—1,38] | 17 12,5 
(1,38 şi mai mult) | 15 12,5 
| 50 50,0 
Din (3.2) găsim 
e ۱ k 5 
X? = — Y nj — n = 3,9 
N i-i 


valoare care nu conduce la respingerea ipotezei Hg, în afară de testul 
ce depăşeşte volumul 0,27. 

Nu am avut nici un parametru de estimat; procedeul nu se 
schimbă în cazul în care se estimează parametrii. 

c) Studiem efectul asupra puterii în cazul claselor cu probabilitáti 
egale cînd dublám pe k. Considerăm cazul unor probabilitáti apropiate 


c. 271 46 83 


Intervalele 


(018 sele) Pii (Pai سب‎ Poi)” (Pri — Poi)*/ pot 
0—0,3 0,259 0,104 0,0240 0,0927 
0,3—0,7 0,244 0,190 0, 0029 0,0119 
0,7—1,4 0, 250 0, 282 0, 0010 0, 0040 
1,4 si mai mult 0, 247 0, 424 0,0313 0,1267 

A 
0,2353 = — 
n 


Probabilitátile py, sint obţinute cu o repartiție gama de parametru 1 
(ca mai înainte) şi 21, cu o repartiție gama de parametru 1,5. Pentru 
aceste patru clase si n = 50 evaluăm parametrul de necentricitate 
(5.5) ca A = 0,2353 x 50 = 11,8. Cu trei grade de libertate obţinem 
pentru X? puterea 0,83 (cind « = 0,05). 

Presupunem acum că formăm opt clase împărțind fiecare din 
clasele anterioare în două clase. Găsim 


ORR Pot Dii (P1i— Poi)? (P431 — Doi* [Poi 
0—0,15 0,139 0, 040 0, 0098 0,0705 
0, 15—0, 3 0,120 0, 064 0, 0031 0,0258 
0, 3—0, 45 0,103 0,071 0, 0010 0, 0097 
0, 45—0, 7 0,141 0,119 0,0005 0, 0035 
0, 7—1,0 0,129 0,134 0, 0000 0, 0002 
1,0—1,4 0,121 0,148 0,0007 0, 0058 
1,4—2,1 0,125 0,183 0, 0034 0, 0272 
2,1 şi mai mult 0,122 0,241 0,0142 0,1163 

A 

0,2590=: == 
n 


Acum, pentru n = 50, A = 13,0 cu 7 grade de libertate. Pentru 
= 0,05 puterea este 0,75. Dublind pe k, A a crescut uşor şi puterea 
s-a redus ; totuşi dat fiind că în cazul de fata n este mic, putem trage 
concluzia că dublind pe k puterea este afectată foarte putin. 

d) Găsim k optim. Am obţinut că puterea este aproximativ 0,8. 
Din tabela 1 avem 


R 


$-1(0,8) = 0,84. 


Qu b = 4, « = 0,05; ua = 1,64, (6.10) dá ca valoare optima pentru k 


9۵1/2 m — 2/5 
Ni je ab Do: Apare 
2,48 


Pentru 4 = 50, obţinem aproximativ k = 15. Construim 15 clase cu 
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probabilitățile po, apropiate. Găsim 


erp eq Pri (Pii — Poi)! Poi 
(clasele) 

NU ede rro ARA A fas 

0—0, 05 0,049 0,008 0,034 
0,05—0,15 0,090 0,032 0,037 
0,15—0, 20 0,042 0,020 0,012 
0,20—0, 30 0,078 0,044 0,015 
0, 30—0, 40 0,071 0, 047 0,008 
0, 40—0, 50 0, 063 0,048 0,004 
0, 50—0, 65 0,085 0,072 0, 002 
0,65—0,75 0,050 0, 047 0,000 
0, 75—0, 90 0, 065 0,067 0,000 
0,90—1,1 0,074 0,083 0,000 
1,1—1,3 0, 060 0,075 0,004 
1,306 0,071 0, 095 0,008 
t; 6—2,0 0, 067 0,101 0,018 
2.0—2,7 0,068 0,116 0,034 
2,7 şi mai mult 0,067 0,145 0,098 

0,274 = — 
n 


Aici A — 13,7 si X? pentru 14 grade de libertate are puterea 
0,64. à a crescut din nou, însă puterea s-a redus deoarece k a crescut. 
Observăm că nu avem o alegere optimă clară. —— ies 

Etapele in aplicarea testului X? pentru verificarea normalitátii 
sint urmátoarele : 

1) Se dá domeniul A al valorilor caracteristicii X, pragul de 
semnificaţie a. ave n 

2) Intervalul valorilor posibile ale caracteristicii X se imparte 
in k intervale (egale sau nu), disjuncte : A; = (4,1, 04), unde 


AAA x ee و‎ 0g = Or dpi سل‎ 0 
şi k este determinat de (6.10). 
Alegem extremitățile de forma 


FEF 
Paty 


r 5 . 5 MS x 
cu s? = Y (2, — 7)?/(n — 1) şi s/2 mărimea intervalului. Se formează 
1 Net : ㆍ 

un tabel în care se trec in prima coloană aceste intervale. — — 

3) Se ordonează cele n observaţii asupra caracteristicii X şi se 
determină numărul de observaţii n, care cad în intervalul 1; frec- 
ventele n, se trec în a doua coloană a tabelului. | 04 

4) În coloana a treia se trec extremităţile a, din dreapta inter- 
valelor. 
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şi se trec în coloana a patra a 


7 ur 
5) Se calculează y, = — 


tabelului. 

6) Din tabelul 1* se găsesc valorile funcţiei lui Laplace in punctele 
y, Şi se tree în coloana a cincea a tabelului. 

7) Probabilitátile p; date de 


sint trecute in coloana a 6-a a tabelului. 

8) In coloana a 7-a se înregistrează np;. 

9) În coloana a 8-a se calculează (n; — np;)*. 

10) În coloana a 9-a se calculează (n; — np;)?[np, : sumind ele- 
mentele acestei coloane se obţine X?. 

Se respinge ipoteza H, conform căreia X este o variabilă repar- 
tizatá normal dacă 

X* > alv). 

Numărul v al gradelor de libertate se calculează cu ajutorul relaţiei 
v = k —l—1, unde l reprezintă numărul de legături suplimentare 


între valorile de observaţie. 
Dacă u şi o? sint cunoscuţi | = 0; în cazul in care y (sau c?) 


n 
sau u şi c? sint necunoscute se estimează prin 2 (san Y (a In | 


n 
sau prin z şi Y (a, — 2)?/n sil = 1 sau l = 2; deci v =k —2 gi 


1 
respectiv v = k — 3. 

Exemplul 6.2. (Iliescu, Vodă (1973)). Pe un strung automat se 
prelucrează cota ,lungime" 6,6-+0,1 a unei bucse. Pentru controlul 
statistie de fabricaţie la strungul respectiv este necesar să se verifice 
ipoteza normalitátii repartitiei valorilor obținute pentru cota res- 
pectivá.* 

In scopul propus, s-a procedat astfel : 

— s-a reglat strungul la cota nominală ; 


* Tabelele notate cu un singur număr sint de interes general si sini trecute la 
sfirsitul cărţii. 
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— din buesele produse in timp de 5 ore de la reglare s-a extras 
o selecţie de n = 74 buese, cărora li s-a măsurat lungimea. Găsim 
k=9 


2 = 6,59; s = 0,041; 8/2 = 0,02. 


S-a obtinut tabelul : 


| | -| | 
ai — X ni—npy)? 
Clasele ni ai لا‎ = DR Dr) Pi | npi 2 
5 npi 
| | | 
1 | | 1 
(—00 36, 52] 3 | 6,52 pr 0,044 | 0,044 | 3,256 0,0201 
(6, 52 ;6,54] 8 | 6,54 4,22 0,111 | 0,067 | 4,958 1,8664 
(6,54;6,56] | 16 | 6,56 —0,73 0,233 | 0,122 | 9,028 5, 3842 
(6,56 36, 58} 15 | 6,58 —0,24 0,405 | 0,172 | 12,728 0,4055 
(6,58 ;6, 60] 10 | 6,60 0,24 | 0,595 | 0,190 | 14,060 1,1724 
(6, 60 ;6,62] 7 | 6,62 | 0,73 0,767 | 0,172 | 12,728 | 2,1886 
(6, 62 ;6, 64] 8 | 6,64 | 1,22 | 0,889 | 0,122 | 9,028 | 0,1170 
(6, 64 36, 66] 4 | 6,66 | 1,71 | 0,956 | 0,067 | 4,958 | 0,1851 
(6, 66 ;+ 00} | 3 | co | co  [ 1,000' | 0,044 3,256 0, 0201: 


Iliescu, Vodă (1973) 


Deoarece am estimat atit pe p, cit si pe 08, v = k — 3 = 6. Cum 
X? ~ 11,36 < y?,5, (6) = 12,59 se acceptă ipoteza de normalitate. 


7. Statistica X^. Aproximatia C(m) 


Să presupunem cá pentru n — oo, unele valori medii rámin 
finite in timp ce celelalte sint mari, adică 
i , 


np, > m, pentru ¿=1,..., 7,81 
np, co pentru 1 = 7 و... و سك‎ 8 


(în acest paragraf notăm numărul claselor prin s). 

În acest caz, repartiţia limită a ultimelor s—r componente ale 
repartitiei multinomiale este normală multidimensională, însă primele 
r componente au repartitii Poisson independente de parametrii 
mı, ....Iespectiv m, si sînt independente de ultimele s—7 compo- 
nente. 

Definitia 7.1. Repartitia limită a statisticii X? poartă numele de 
repartiţia C(m) si aproximatia C(m) pentru P(X? > c) este definită 
a fi probabilitatea calculată cu această repartitie limita. 
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Repartiția C(m) cu parametrii k = و‎ — 1, r, m = (mı, ...,m,) 
este repartiția statisticii 


E (Ut — my 


(xl m; 


(7.1) > x*Tk —1), 


unde U, ~ P,(m,) si Ui, ..., Un Xk — r) sînt independente. 
Mai precis, pentru fiecare valoare fixată a lui n, m, ..., n, au O 


repartiție multinomialá cu parametrii n, p(n), ..., p,(n), unde 


Y p(n) P 1, 


a 
ll 
- 


gi p(n) > 0 pentru i = 1, ..., s. Notám că p,m) pot depinde de ۰ 
Fie (U,) un sir de vectori astfel încît componenta i a lui U, este 


U(n)-—n pentru 4 —1,..., f, 
(1.2) U,(n) pu f P pentru i = r + 1, ..., 8. 
npn) 


unde re (0,1, ...,5—1]). 
Teorema 7.1. Dacă 


lim p(n) = p, > 0 pentru i = 1, ...,s 


lim np(n) = m,. Peniru d —1,...,T $i 
“00 


p¡>0 pentru i =r -b1,...,8, 


atunci U, converge în repartitie către vectorul U = (Ui, Us, و۰۰۰‎ Us), 


unde 
a) U,, ..., U, sînt variabile aleatoare independente avînd repar- 
tili Poisson de parametri mu, ..., respectiv m, 


b) U,44,..., U, au o repartiție normală singulară de rang s —r—1 
în hiperplanul 


y Ui V». = 0, 


f=r+1 
ou mediile zero și matricea de covariante A = 1 — pp’, unde 
i ut سب‎ 
p = Wars e Vp.) 


și I este matricea identitate de ordin s — ۰ 
e) (Ur, ..., U,) si (Ursa «++, U,) sînt vectori independenţi. 


RR 


Demonstratie. Funcţia caracteristică a variabilelor m,. .., n, este 


(p(n) e + ... + palm) e). 
Atunci funcţia caracteristică a lui U, este 


Q4, — exp (== y t ۱ npy(n) ۱ x 


j=r+1 


x (X mn exp (it) $ pim expt Via) 


j=) 7=7+1 


«n 
m. 


In y, =—i/n Y d Vpn) + n n ( y, p(n) explit,) + 


j=r+1 j=l 


+ Y min) expGt npn) - 
j=r+1 

Deoarece lim p,(n) = p, > 0, pentru (tj, j =r + 1, ..., 8, ره‎ e 

= t;[| np;(n) este mărginit uniform in n. Deci 

it, G 


y np,(n) 2np,(n) 


exp (it,//mp,(m)) = 1 + + 0(n-9/2), 


y p(n) explit, 22700) =1 — y pin) + 


fr! $51 
NOTOS SG 
= A اد = مسب‎ O(n? 
F v» Vn feria 2n FO ) 
si 
In o, = —i)n y t Vpn) + nn (1 + A,), 
j=r+1 
unde 
e it Van) , 2, mp,(m) , it Ps 
oen, SEPTA NUS el =D Se Ww هو‎ O 
j=r+1 Vn 2 n 2n ; 4i ۶ Pi ) 


Deoarece lim np,(n) = m, pentru j =1,..., r, np,(n) este 
1—00 


uniform mărginită în n. Deci 
A, = 0(n-1?) şi |A,|<1 pentru » suficient de mare, 
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astfel incit 


nin(1 + 4.) = nA, + A + 0(n-12), 


Primul termen din A, este 0(n71/?) în timp ce termenii 2 gi 3 sint 
0(n-1). În consecinţă, numai pătratul primului termen este reținut 
în (n/2) A} ca 


` s Se IND 
nin(1 + A,) = nA, + 개 yt 20) + 0(n-1?), 


= j=r+1 
gi 
r it, 1 1 s ^ #5 Mee duct MR i 
Ing, = Y »p((n(e —1 ——| Y tj — ( Y AO) 4-0(n-V?). 
j=l 2170 j=r+1 


Din ipoteză, lim np,(n) = m, pentru j = 1,..., r gi lim pn) = p, 


100 "-oo 


pentru j = r + 1, ..., $; urmează cá 


r i 1 s s EE 
lim In 9, = Y mle! foe be | Y hs ( y 5 V»,) | 
j j=r+1 


n—00 j=1 =7+1 
gi că 
= lim 9, = exp | Y m,(e! — »| x 
و 0 + و‎ 
(7.3) i : 
1 3 E. z HA A ENS 4 
X exp ES NW | 2 t Vp) ۰ 
2 |; j=r+1 J 


Din (7.3) şi din teoremele de continuitate pentru funcții caracteris- 
tice, rezultă cá U, converge în repartiție către vectorul U, care are 
funcţia caracteristică Û. Prima exponențială din d este funcția 4 
caracteristică comună a r variabile aleatoare independente (71, Uz, 
..., U, avînd repartitii Poisson de parametri mi, ...,m,. Ultima 
exponențială din y este funcția caracteristică a variabilelor U,.,x, 
..., U, avînd o repartiție singulară normală de rang s—r—1 în 
hiperplanul 
Ss 


y ump, = 0 


i=7+1 
cu mediile zero şi matricea de covariante A definită în (0). De ase- 
menea, deoarece d este produsul a două functii caracteristice vec- 
torii aleatori (U,,..., U,) şi (U,445 -.., U,) sînt independenţi. În 
consecinţă U are repartiţia specificată de teorema 7.1. 
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Teorema 7.2. În condițiile teoremei 7. 1, statistica 


X A OR) s npn)? 


i=l np,(n) 


converge în repartitie, cînd n > co, către repartiția C(m) cu parametrii 
k = ول و‎ 2 sim = (My, ..., ™,). 

Cochran consideră cazul special r= 1 gi np, = m, si deci în 
acest caz un mod de obţinere a repartitiei C(m). De asemenea dă un 
tabel cu probabilitățile cozii superioare a repartitiei C(m) pentru 
punctele superioare de 1% şi 5% ale repartitiei y? în cazul 7 
m, = Ma = 1. Nu consideră cazul r > 2. 


Aproximatia y? dă erori serioase in-cazul în care unele valori 
medii sînt mici şi restul sînt mari. În aceste cazuri aproximatia O(m) 
prezintă acuratețe şi eroarea in aproximatia y? este bine aproximatá 
de diferența dintre aproximatiile y? si O(m) pentru P(X? > 0). 
Astfel partea principală a erorii în folosirea .aproximatiei x? obis- 
nuite poate fi studiată fără a avea calculată P(X? > c). Considerind 
numai cazul special în care r medii, m, ..., m,, miei au o valoare 
comună 72, aproximatia O(m) poate fi calculată rapid pentru valori 
ale lui s < 100. Explicaţia acestui fapt este că repartiţia C(m) este 
simetrică în U,,..., U, si că poate fi calculată prin sumare pe re- 
giunea U, < < U, in loc de a suma r! regiuni de acest tip. 
Astfel aproximatia C(m) face posibil studiul efectului a r medii egale 
mici asupra erorii in aproximatia x? pentru r —1,...,9 — 1 gi pentru 
valori ale lui s de la 3 la 100. 

Eroarea considerată este P(O (m) > 0.) — a, unde c, este 
«-punetul percentilie superior al repartitiei y?(s — 1) si C(m) este 
variabila aleatoare avînd repartiţia O(m) cu parametrii k = 8 ول‎ 
۲ gb mM =... =m, = m. Tabelul 7.1 dá P(C(m) > 0.) pentru « = 
= 0,01 cînd m,,...,m, au valoarea comună m, pentru m = 0,1; 
0,5; 1, 2, 3, 5. Tabelul 7.2 dă acelaşi tip de date pentru « = 0,05. 
Marginile superioare pentru erori sint determinate empiric din datele 
cuprinse în Tabelele 7.1 şi 7.2. 

Eroarea este proporţională cu r/m cu constanta de proportiona- 
litate, notată prin B, depinzind de « şi de gradele de libertate (k=s—1). 

Marginile erorilor sînt 


o 
= á, 


1 
eroarea < OPALI I di 0,01, 
CR 0 ur ۳ 
eroarea <. ” eind a = 0,05. 
8 m 


Marginile superioare pentru erori din (7.4) sint de asemenea 
margini pentru valoarea absolută a erorii in toate cazurile calculate. 
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Tabelul ۰ 


x^, P(C(m) > 


6 0,01) 


Valoarea*comuna a mediilor mici 


N m 


wym 


OA دب‎ N e A ob e 


= 
مه w‏ جر ی و ه 


0,1 


0, 0334 
0, 0175 


0,0258 
0,0307 
0,0369 


0,0230 
0,0316 
0, 0429 
0,0616 


0,0213 
0,0315 
0,0449 
0,0642 
0,0902 


0,0180 
0,0261 
0,0340 
0,0414 
0,0481 
0,0545 
0,0987 


0,0144 
0,0186 
0,0227 
0,0267 
0,0306 
0,0344 
0,0485 
0,0777 
0,1009 
0,1202 
0,1400 


0,0124 
0,0148 
0,0171 
0,0193 
0,0215 
0,0237 
0,0321 


0,5 


0,0195 
0,0286 


0,0209 
0,0320 
0,0430 


0, 0197 
0,0303 


0,0452 


0,0579 


0,0172 
0,0237 
0,0289 
0,0316 
0,0268 


0, 0139 
0,0175 
0,0210 
0,0243 
0,0275 
0,0304 
0,0409 


0,0110 
0,0120 
0,0130 
0,0139 
0,0149 
0,0159 
0,0196 


0,0105 
0,0110 
0,0115 
0,0120 
0,0124 
0,0129 
0,0148 


1 


0,0181 
0, 0263 


0,0144 
0,0177 
0,0172 


0,0139 
0,0177 
0,0213 
0,0246 


0,0137 
0,0173 
0,0207 
0,0241 
0, 0252 


0,0123 
0,0146 
0,0169 
0,0190 
0,0212 
0, 0232 
0,0288 


0,0105 
0,0110 
0,0115 
0,0120 
0,0125 
0,0130 
0,0150 


0,0102 
0,0105 
0,0107 
0,0110 
0,0112 
0,0114 
0,0124 


Probabilitatea cozii repartifiei C(m) în punctul percentilie de 1% al repartitiei 


0,0119 
0,0131 


0,0112 
0,0125 
0,0140 


0,0112 
0,0124 
0,0136 
0,0144 


0,0110 
0,0120 
0,0129 
0,0139 
0,0147 


0,0106 
0,0111 
0,0117 
0,0122 
0,0128 
0,0134 


0,0101 
0, 0102 
0,0103 
0,0104 
0,0106 


N 


دل دب 


سادا تن ~ 


[28 یں‎ vl 


۲ 3 نت < ات ي 6 


= 


= 
Occo 


ND 
= 


h 


QU. ثب‎ 
ooo 


coc ot 


= 


0,1089 
0,1813 


0, 1143 
0,1860 
0,2596 


Tabelul 7.2 


Coada probabilitátilor usps C(m) tn punctul percentilie de 5% al repartitiei 
2, P(C(m) > Co,05) 


0,0737 


0, 0552 
0,0605 
0, 0656 
0,0707 
0,0755 
0,0798 
0,0853 


0,0517 
0, 0533 
0, 0549 
0, 0865 
0, 0581 
0, 0596 
0, 0656 


0, 0480 
0, 0414 


0, 0538 
0, 0592 
0, 0665 


0, 0553 
0, 0612 
0, 0682 
0, 0785 


0, 0540 
0, 0584 
0, 0640 
0, 0692 
0, 0646 


0, 0528 
0, 0556 
0, 0584 
0, 0611 
0,0639 
0, 0666 
0,0741 


0, 0509 
0,0518 
0,0526 
0, 0535 
0, 0544 
0,0552 
0,0586 


0,0505 
0,0509 
0,0514 
0,0519 
0,0523 
0, 0528 
0,0546 


Valoarea comuná a mediilor mici 


0,0474 
0, 0504 


0, 0528 
0,0554 
0, 0581 


0, 0517 
0,0536 
0, 0555 
0, 0592 


0,0516 
0,0534 
0,0551 
0,0570 
0,0548 


0,0515 
0,0530 
0,0546 
0,0561 
0,0577 
0, 0592 
0, 0665 


0,0505 
0,0509 
0, 0514 
0,0518 
0,0523 
0,0528 


0, 0502 
0,0505 
0,0507 
0,0510 
0,0512 


0,0476 
0, 0436 


0, 0500 
0, 0502 
0, 0501 


0,0504 
0, 0508 
0,0511 
0, 0504 


0, 0506 
0, 0513 
0, 0519 
0, 0523 
0,0515 


0, 0506 
0, 0512 
0,0519 
0, 0525 
0, 0532 
0, 0538 


0,0502 
0,0504 
0,0506 
0,0508 
0,0510 
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Nu avem nici o eroare negativă pentru « = 0,01. Pentru « = 0,05 
apar erori negative numai pentru 2 si 3 grade de libertate; în aceste 
cazuri valoarea absolută a erorii satisface (7.4). 


În cazul general al mediilor arbitrare m,,...,m,, o margine 
conservativa simplă este sugerată de 
b r 
(7.5) |eroarea| < —- 


o SEI J‏ میس 
min(m,)‏ و 


unde 5,55 = 9,047 şi Boo, = 0,031. Marginea (7.5) a fost testată prin 
calcularea probabilităților cozii superioare a repartitiei O(m) (pentru 
a = 0,01 si 0,05) în cazul r = 2. Acestea au fost date pentru toate 
combinaţiile de m, gi ma în (0,1; 0,5; 1; 2; 3; 5) sik = 2, 3, 4, 5, 
10, 20,50,100. In fiecare caz marginea (7.5) a fost satisfăcută. 


8. Testul X? cu intervale aleatoare 


8.1. Repartitia statisticii test în ipoteza nulă 


Considerăm că X,, Xs, ..., X, este o selecţie asupra unei varia- 
bile aleatoare X cu funcția de repartiție F(x; 0). Statistica X? are 
forma 

k 
(8.1) X? = Y (m — np)? (mp), 

t=1 
unde p, este un estimator pentru p, (probabilitatea ca variabila X 
sá ia valori în clasa 1, $ = 1, ..., k). 

Vom nota prin X} statistica X? din (8.1) modificată cînd limitele 
claselor sînt aleatoare si estimatorii sînt obţinuţi din datele negrupate. 

Dahiya, Gurlan (1972) consideră următoarele notații si pre- 
supuneri : 

i) Fie px(x; 9) densitatea variabilei X, unde 


(8.2) o = (8, ..., 9) 


Presupunem Că px(x;@) este continuă in v» şi derivabilă în raport 
cu 0. 

ii) Fie 0 estimatorul lui 0 bazat pe datele negrupate cu proprie- 
tatea că există funcţiile fv), ۶ = 1, . . . q, care pot depinde de 0, 
astfel încît 


(8.3) "EA 우시 eter NI 


N a=1 
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unde f si e sint vectori 0 x 1, 
MüCX4)j = 0, D*{i(Xa)} 

este finită şi 

iii) Presupunem că domeniul variabilei X este (—oo, co) şi că 
este partitionat in k(k > q) intervale disjuncte 840), i = 1, ...,k 
ce depind de 0 astfel cá S,(@) este intervalul 

9-8) > X > gu), 

unde g; sint funcţii de 0 cu derivate parțiale continui. 


iv) Fie 
(8.4) m, numărul de X,(« = 1, ..., n) ce cad in SÓ). 
(8.5) 2.0) = P(946) |0 = 6) — F(g.-,(8) | 0 = 6). 


Repartiția asimptotică a statisticii X} este dată in 
Teorema 8.1. (Dahiya, Gurlan (1972)). În condițiile de regularitate 
i—iv statistica 


k ^ ^ 
(8.6) Xk = Y tm, — np(9)?/ (np(9)] 
t=1 
are aceeași repartiție asimptotică ca şi 
k 
Y AZ, 
i=l 


unde Z,, Za, ..., Zy sint independente şi repartizate N(0,1). 
d - ++, A, Sînt rădăcinile caracteristice ale matricii D*E, unde 


x =D, — pp —U'W — W'U — U'GU, 


(Pi 
0 
D, ED Pa , 
9 ice 
Pk 
£;(0) 
P 0 250 
p = (Pi, +++ De), U = (Uj, ..., Us) Un= P42: aa, 
£, 4(0) 
AÛ) 
W = (Wy و..۰‎ Wr), W= f(x) px(w; 0) da, 
£, 400) 
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G = M(t(X) t(X)'] este matricea de covariante a lui 1(X). ۶ 
U, si W, sînt vectorig X 1. 

Corolarul 8.1. Dacă 0 este estimatorul de verosimilitate maxima 
pentru 0, atunci k — q — 1 rădăcini caracteristice M sînt 1, q variază 
între 0 gi 1, un A, este zero și asimptotic, X} are aceeași repartiție ca și 


(8.7) SAR ag IE ZI A se AE 


Observaţie. În general, 4,,..., A, depind de parametrul necu- 
noscut 6, însă în cazul q = 2, repartiţia asimptotică a statisticii 
۰ ㆍ ㆍ I" ㆍ Yv A 
X3 nu contine parametru de locaţie gi de scară (0, si 012) dacă 0 
folosit în X2 este estimatorul de verosimilitate maximă si limitele 
A A .p. 
claselor sînt de forma 6, + c;0, unde c, sînt constante specificate. 
Cind 0 = 2 este posibil, în anumite condiţii, ca repartiția asimp- 
totic a statisticii X2 să fie independentă de 0, şi 0, fara presupunerea 
că 6 este estimatorul de verosimilitate maximă pentru 0. O demons- 
tratie a acestui fapt este dată în teorema 8.2. Acest rezultat are o 
deosebită importanţă practică deoarece în anumite cazuri estima- 
torul de verosimilitate maximă poate fi obţinut cu dificultate. 


Teorema 8.2. (Dahiya, Gurland (1972)). Dacă 
i) X are densitatea (1/01?) Px{(w — ,)/62}, unde 0, $i 01? sînt 
parametrii de poziție şi respectiv de scară astfel încât 
M(X) = 0, si DAX) = 05, 


Pro — 6,)/ 03/7} fiind continuă în æ gi derivabilă in raport cu cei dos 
parametru. 


ii) 6’ = (7,82) unde X e pile oW N e A UP ب‎ 
n n 


iii) g(0) = X + e$, i = 0,1, ۰۰۰۵ k, 
atunci : a) X} definită în (8.6) are asimptotic aceeași repartiție ca 68 


2 ZE gi 


b) X3 este invariantá în raport cu parametrii de poziție gi de scară. 


8.2. Reglunea critică bazată pe X pentru verificarea normalității 


Repartiția asimptotică, în ipoteza nulă a statisticii X5, obţinută 
în $ 8.1. poate fi utilizată în obţinerea regiunilor critice pentru veri- 
ficarea normalitátii. Mai precis, ne propunem să verificăm ipoteza 
H, conform căreia X,, Xy, ..-, X, este o selecţie asupra unei variabile 
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aleatoare cu densitatea de repartiție 


1 1 
:)بر‎ 0) = ——— exp} )ات‎ — 0.) 0 0 = co: < 0 OF 
Px( x; 9) (270,1 »| 26, |, 2 ’ 1 


(8.8) 
Ca estimator pentru 0” = (0,, 03) luăm etimatorul de verosimilitate 
maximă ð’ = (X, 69). 

Limitele intervalelor sint 


g(8) = X +08, i= 0, 1,2. E, 


unde constantele e, sînt alese astfel încît pô), i = 1, 2, ..., k sint 
egale toate cu 1/k, adică 


pÂ) = Fíg40)10 = ô} — F{g,-1(6)| 0 = 8) = 


(8.9) E ۱ 
APART 


Faptul cá alegem intervale cu probabilitáti egale apare rational dacá 

ne gindim că în general nu apar clase cu puţine observaţii sau, dacă 

apar, toate clasele au observaţii puţine, deci volumul selecţiei este 

mic. Constantele c, sînt determinate cu ajutorul funcţiei lui Laplace. 
După teorema 8.1, statistica, 

k 1 2 k 

By (m, nlk _ k y m? 


8.10 
( ) 기 nfk n i 


naL 


are asimptotic aceeași repartiție ca şi 
(8.11) yk — 3) + MZA + 가. 


Expresiile simplificate pentru A, gi A, (Watson (1957)) sint 


k 1 k 
(8.12) ۸ 1-1 ٩ Yi), A, =1 at s y; vid, 
l=1 i=l 
unde 
(8.13) p(l) = cele.) — 61-1 (4-1), 
(8.14) p(u) = e CET. 
27 


Pentru a folosi statistica XZ ca statistică test sint necesare constantele 
e, care specifică limitele intervalelor. Tabelul 8.1. dă valorile con- 
stantelor e, ce corespund la k clase, k = 3 la 15. 


47 


Tabelul 8.1. 


Valorile به‎ ee apar în limitele claselor (X + c¿S) pentru clasele cu probabilitáti egale în 
verificarea normalitáfii bazate pe X% 


05 06 Cy 


k | Cy Ca 


Ca | & 


3 | —0,4307 

d e-0:87451 0 

5 | 0,8416 | —0,2533 

6 |—0,9074| —0,4307| 0 

7 <| —1,0676 | —0,5659 | —0,1800 

8 | —1,1503 | —0,6745| —0,3186| 0 

9 |—1,2206| —0,7647 | —0,4307 | —0,1397 

10 | —1,2816| —0, 8416 | —0,5244| —0,2533| o 

11 | —1,3352| —0,9085 | —0,6046 | —0,3488 | —0,1142 

12 (| —1,3830| —0, 9674 | —0,6745| —0,4307 | —0,2194| 0 

13 | —1,4261| —1,0201 | —0,7363 | —0,5024 | —0, 2934 | —0, 0966 

14 | —1,4652| —1,0676 | —0,7916 | —0,5660 | —0, 3661 | —0,1800| 0 
15 —1,5011| —1,1108| —0, 8416 | —0,6229 | —0,4307 | —0, 2533| —0,0837 


Co = —oco şi c, = co pentru toti k = 3 la 15. 
Ceilalti c, pot fi gásiti din simetria fatá de zero, adicá din urmátoarele 
relații : 


Lm à 1 
^ mns m2 TA ama) li == Mi ok - 파 , pentru k impar; 
[4 = —C ۱ a 1 9 
— ZI t=1,...,5(h — 2) , pentru k par. 


Rădăcinile caracteristice A, şi A, corespunzătoare celor k clase, k = 3 
la 15, cu probabilitáti egale sînt date în tabelul 8.2. 

Fie 
(8.15) XR > dia 


regiunea, critică de volum « pentru verificarea ipotezei Hg. Deoarece 
repartiţia asimptotică a statisticii X} este dată de (8.11), alegem 
dia astfel încît 


(8.16) P(x? (k — 3) + ZÎ + MÍ > du) = 이 


Pentru a găsi constantele d, este necesară repartiția sumei ponderate 
de variabile aleatoare independente repartizate y?. 

Gurland (1955, 1956) consideră pentru astfel de repartitii dez- 
voltări Lagueriene. De asemenea aceste repartitii sînt cercetate de 
Kotz, Johnson, Boyd (1967). 

Folosind aceste tehnici, Dahiya, Gurland (1972) calculează 
valorile d, pentru « = 0,10; 0,05 si 0,01 si pentru k = 3 la 15. 
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Aceste valori sînt date în tabelul 8.2. Pentru valorile triviale 
ale lui d, ,, s-a folosit aproximatia a x2(b) + c care are aceleaşi prime 
trei momente ca variabilă din (8.11). 

Tabelul 8.2 include, de asemenea, valorile d£? ;,, ale repartitiei 
x2(k — 3), adică 


(8.17) P[xX&k — 3) > di-ia] = ۰ 


Tabelul 8.2. 


Punetele eritice d; y, رو‎ a si valorile corespunzătoare ale lui A, şi A, pentru repartifit 


normale 
0,10 0,05 0,01 
k A x 
ps dk, a 0-0, a dk, a dk-3, a dk, a dis, a 0 


3 2,371 3, 248 5,418 0,207 | 0,779 
4 3,928 2, 706 5,107 3,841 7, 917 6,635 0,139 | 0,633 
5 5, 442 4,605 6, 844 5,991 10,075 9,210 0,103 | 0,532 
6 6,905 6,251 8,479 7,815 12,021 11, 341 0,081 | 0,459 
7 8,322 7,779 10, 038 9, 488 13,837 13,277 0,069 | 0,404 
8 9,703 9,236 11,543 11,070 15,567 15,086 0,055 | 0,361 
9 11,055 10,645 13,007 12, 592 17,234 16,812 0,047 | 0,326 
10 12, 384 12,017 14, 438 14,067 18,852 18,475 0,041 | 0,298 


, 
11 13, 694 13, 362 15, 843 15,507 20, 431 20, 090 0,036 | 0,274 
12 14,988 14,684 17,226 16,917 21,977 21, 666 0,032 | 0,254 
13 16,267 15,987 18,589 18, 307 23,495 23,209 0,029 | 0,236 
14 17,535 17,275 19,937 19,675 24,990 24,725 0,026 | 0,221 
15 18, 792 18,549 21,270 21,026 26, 464 26,217 0,024 | 0,208 


a = pragul de semnificaţie, k = numărul de clase 


Observaţii. i) Scopul introducerii valorilor d sa în tabelul 8.2 
este de a arăta eroarea ce apare dacă presupunem că X} ~ x*(k—3) 
(adică dacă neglijăm A, si à), repartiţia adevărată fiind dată de 
(8.11). Pentru valori mari ale lui k diferența dintre d, « Şi dj_s nu 
este atit de mare ca pentru valori mici ale lui k. Pentru k = 4 dife- 
renta este aproximativ 1,3 iar pentru k = 15 de aproximativ 0,3. 

ii) În cazul k = 3 nu avem intrări pentru d£ مرو‎ Ou alte cuvinte, 
Xî este baza unui test pentru normalitate pentru cazul k = 3, 
în timp ce testul X? bazat pe intervale de lungime fixată şi pe esti- 
matori ai parametrilor nu constituie un test pentru acest caz. 

iii) Prin aceeaşi tehnică pot fi obținute tabele pentru teste de 
ajustare pentru alte repartifii continue cu parametri de poziţie şi de 
scară necunoscuţi. 
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9. Teste pentru verificarea ipotezei conform căreia caracteristica sub 
cercetare este un vector normal 


Fie Z, Zs, ..., Z vectori aleatori v-dimensionali independenţi 
şi identic repartizaţi cu funcţia de repartiție F(z) de vector valoare 
medie 0 si matrice de covariante unitate şi fie 


X, =BZ,+H,1=1,2,...,2, 


unde p este un vector v-dimensional, necunoscut şi B este o matrice 
v X v nesingulará, necunoscută. Ne propunem sá verificám ipoteze 


asupra funcției de repartiție F(z) cu ajutorul selecţiei X,,..., Xp. 
Fie 
E $5 
n 2 
şi 
S i y (X, — X) (X, — X)' (covarianta de selecţie). 
1 


n—1 


Dacă F, este continuă, S nu este singulară cu probabilitatea 1 si 
repartiţia, selecţiei transformate 


Y, = $-¥(X, — X) 


nu depinde de parametrii necunoscuţi y si B. Deci am redus problema 
la verificarea unei ipoteze simple. Din punct de vedere teoretic nu 
există nici o dificultate în aplicarea oricărui test cunoscut. Singura 
problemă care se ridică este tabelarea repartitiei asimptotice, repar- 
titie ce depinde de Fo. 

Malkovich, Afifi (1973) rezolvă problema după cum urmează : 
Fie € un vector unitate v-dimensional si T(w,, ..., Un) o statistică 
unidimensional. Atunci versiunea v-dimensionalá a statisticii T este 


max MEZ ..., Za) 
c 


sau 
máx ۸) بل‎ ..-, €X,). 
6 
Ei cercetează oblicitatea şi excesul, testul Shapiro-Wilk şi propun 
statistica, 3 
M, ود‎ NAT rad (X, T X)S-1(X, — AX). 

Dacă F, este funcția de repartiție a unui vector N (0,1) ale 
cárui coordonate sint variabile independente repartizate N(0, 1), 
atunci M,/v ~ F(v, n — v). 
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o ammm 


E sna RA ERD i 


Dacă F, este funcția de repartiție a unui vector N,(0, D, (Y,, 
Y, ..., Y,) este independentă de statistica X, S. Fie S, matricea 
Wishart cu n — 1 grade de libertate şi de parametru v şi fie 
£ ~ N,(0,D, S, şi e independente una de cealaltă gi de selecție. 
Atunci elementele selecției modificate (transformarea v-dimensională 
a lui Durbin (1961)) 


x 
| Yn 
sint variabile independente repartizate N,(0, I). 

Transformarea v-dimensională (Stórmer (1964)-Sarkadi (1967)) 
în doi pași este definită după cum urmează. La primul pas se elimină 
parametrul necunoscut p cu ajutorul mediei modificate 
m. At A 


n —1 


(9.1) 2, = 5-127, + 


£L ite: E, Y 


X = 


Elementele transformate sînt 
1 

] 

h سس‎ 
n 

Variabilele X, sînt independente, media lor este zero şi matricea lor 

de covariante este egală cu a variabilelor inițiale X,. Observăm că 


~ X eom Îi md 


Bel 
Y XX; 


—1i‏ وه 


S = 


şi deci covarianta modificată este 


T de a 
(n — 1S Y «۳ 
"ej > 


Un 


xy n—v—1l1 
C, si C, definiti de 


C TES SX ec 가 cons 
C, = مق‎ ..., 5k 


sînt independenţi si repartitiile lor nu depind de parametrii necu- 
noscuti u, B. Dacă transformăm elementele lui C, în elementele unei 
matrici Wishart Sj cu n — y — 1grade de libertate si parametru 
y, transformarea 


(9.2) K SPIO SL O O 


conduce la variabile independente, repartizate N(0,1). 
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Transformarea (9.1) dă nv variabile independente repartizate 
N (0,1) si transformarea (9.2) dá (n—v—1) v astfel de variabile. 
Deci putem aplica un test de concordanță unidimensional pentru 


variabilele Z, sau ; Prin această metodă verificăm numai repartiţia, 
vectorilor v-dimensionali gi nu verificăm independența componentelor 
lor. Se pare că acum singura metodă corespunzătoare este testul X2. 

Deci dacă dorim sá verificám cu ajutorul testului X? faptul că, 
un vector este normal multidimensional putem folosi versiunea multi- 
dimensională a transformării Durbin sau Stórmer-Sarkadi si dupa 
aceea aplicăm testul X*. O altă posibilitate este de a aplica, testul 
X? la variabilele Y, standardizate. Acest procedeu a fost cercetat de 
Moore (1971) care generalizează rezultatul obţinut de Chernoff- 
Lehmann (Observatia ii) a teoremei 4.1) pentru cazul cind marginile 
claselor sint aleatoare. Repartitia limita a statisticii depinde de mar- 
ginile claselor însă nu depinde de parametrii necunoscuţi y, B. 

A treia, posibilitate este de a aplica testul X? la selecţia originală. 
În acest caz repartiţia limită depinde de marginile claselor şi de 
parametri necunoscuţi, însă efectul acestei dependențe este moderat 
dacă numărul claselor este mare. 

Popoviciu (1978), Popoviciu, Văduva (1980) dau testul X? pentru 
verificarea ipotezei de normalitate atit în cazul multidimensional 
specificat, 016 şi în cel nespecificat. 

Tratăm mai întîi cazul specificat. 

Dacă X ~ N;(p, X), atunci 

& = (X — p)'E-'(x — p) ~ x(k) 3 
şi înlocuim ipoteza H: X ~ N,(p, £) cu ipoteza H: E ~ y*(k). In 
acest mod intervalele A; e R” devin 


A, = [4-1 4] € [0, co). 


Intervalele vor fi determinate după cum urmează : 


a) se determină un interval centrat în k—2 (punctul de maxim 


al densității variabilei y2(%)); se notează cu Ac. 

b) se determină intervale din ce în ce mai mici, parcurgind axa 
reală de la Ac spre stinga și mergind pînă la zero ; în acest mod ag = 0 

c) se determină intervale din ce in ce mai mici, parcurgind axa 
reală de la Ag spre dreapta ; se ia a, = oo. 

Numim intervalele din stînga intervalele A,,...,A¢. Intervalele 


situate la dreapta lui Ag le numim intervale la dreapta. Determinarea, 
tuturor intervalelor se poate face dacă se indică raportul de împărţire 
(stînga, dreapta) a celor L intervale. Notăm cu RAIMIN acest raport. 
În acest fel 


SPA aee 
| RAIMIN 


unde [a] este partea întreagă a lui a. Numărul intervalelor din dreapta 
este L—c. 
Din ecuaţia, 


ERE 


se determină y = 2(k — 2) )/Le(e c+1)]. În acest mod lungimea 

intervalului A, este y, a lui A, este 2y sau, in general, lungimea lui 
Au =(§+1)¥,j = 0, e — 1. 

Pentru intervalele din partea dreaptă: 


lungimea lui Aves = AL رل( — 0 چ‎ j =1, L =el. | 


Pentru vectorii de selecţie X,, j = 1, N, se calculează | 
E, == (X, Ivy p|'z-W(X, = EJ = A N. 


Frecvența f, pe A, reprezintă numărul de căderi ale lui £j în Ay. 


Probabilitátile p; pe A,, i = 1, L sint 


d ۲ | 
1 Fata is 


MES | ‘er TE d 
orep | — 
em) 


i-1 
ceea ce permite calcularea statisticii X? (in notatiile autorilor T) 
L Weed .)2 
y y e Np | 


i=l Np, 
Se respinge ipoteza de normalitate dacá Y? > yalL — 1). 
În cazul nespecificat se estimează parametri iig si E prin 
A i 
Weise y X ) 
Ae. en 
^ 1 1 ^ 
É = >; (X, — (X, — f) 
Ny Va 1 i 


. A > 4 TINTA 3 | 
folosindu-se nu întreaga selecţie, ci primii n, vectori. | 
Se înlocuiește ipoteza X ~ N(f, E) prin ipoteza | 


Eu no. EN Anei, Cas 2 
Ao NS ar ARA 
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Cu ajutorul lui fi și È se calculează 


Ey = (X, — p) E-_X, —M,j=M+1,N 


iar pe baza lui E, se calculează frecvențele fi, î = Ll pe intervalele A,. 
Se calculează probabilitățile p, pe intervalele A, à = 1, L : 


TE a, m 

k A[2 (=) Li k TR 

E (CE? ۱ +) ost‏ وا 
ti‏ 2 9 


Se calculează statistica X2 : 


7۳9 Y [f — (N — mp 

ici (N — (+ 
şi se respinge ipoteza de normalitate dacă 

k(k + 3 
x > 4 (Z Sites cu zi]. 
2 

Autorii dau structura programului, descrierea parametrilor subru- 
tinelor si interpretarea rezultatelor. 


10. Programe si subprograme FORTRAN privind testul X* 


În continuare vom prezenta cîteva, din programele ce se pot serie 
pentru calcularea valorilor unor parametri gi ale variabilelor descrise 
în acest capitol şi modul cum pot fi ele folosite în aplicaţiile practice. 

Majoritatea soluţiilor problemelor sînt prezentate sub formă de 
subprograme şi uneori sînt indicate 81 programe principale în care 
se citesc datele, se apelează subprogramul respectiv si se tipăresc 
rezultatele. 

Pentru fiecare variabilă sau tablou din lista de parametri se 
specifici semnificația, tipul si eventual limitele corespunzătoare lor. 

1. Pornind de la formula (2.3), subprogramul funcție HIPT 
a cărui schemă logică este dată în fig. 1.1. calculează valoarea X* 
plecind de la frecvenţe și probabilitățile corespunzătoare. În sub- 
program am presupus că toate probabilitățile date sînt nenule. 


FUNCTION HIPT (N, P, K) 
DIMENSION N(K), P(K) 

NI =Ø 

DO1I=1,K 
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HIPT = 0. 
DO2 7 =1,K 
Pl = NUI) — N1+ PU) PE: 


| | HIPT = HIPT + P1 + P1/P(1) | 


1 21 = Ni--N() 
| 
| 


HIPT = HIPT | FLOAT (N1) 
RETURN 
END 


HIPT=HIPT> 
۱۱۱۱۱-۸۱۰ PU)? 
PU) 


unde : 


N — vectorul frecvenţelor (întreg), 

P — vectorul probabilităților (P(I) > 0 
pentru orice J) (real). 

K — dimensiunea celor doi vectori (întreg), (RETURN 

HIPT —valoarea obţinută pentru X? (real). Fig. 11 

2. In cazul in care probabilitátile sint egale (deci au toate va- 
loarea 1/K), valoarea lui X? se poate calcula cu o variantă a supro- 
gramului HIPT pe care l-am numit HIP T1 si a cărui schemă logică 
este dată în fig. 1.2. i 
FUNCTION 22221 (N, E) 
DIMENSION N(K) 


HIP TI = Ø. HIPTI=0 
POLT eed e ابا‎ aS 
| N2=N(1) | 
| 


۱۱ 2 NIN ID) 
HIPT1=HIPTI+N(1) 


Ni = N1 + ۷9 | 
1 HIPT1 = HIPT1 + No « N2 
HIPT1 = HIPT1 + KINI — NI 
RETURN 

END 


HIPT = HETEK -N1 


RETURN 
Fig. 1.2 
unde : 
N — vectorul frecvenţelor (întreg), 
K — dimensiunea, vectorului N (întreg), 
HIPT1 — valoarea obţinută pentru X? (real). 
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3. 'Pinind seama de formulele (2.8—2.14) se poate scrie sub- 
programul HROA RE a cărui schemă logică este dată in fig. 1.3 pentru 


calculul erorii care se face la aproximarea lui 
P(x*(KX. — 1) < o). 


S1«(S- K2K« 2)/ 8 
S2=(S-3K-6K+4)/26 
6012 eC 


۸۵ ۲4+ 1 
Ri = R-(C-A) 
R2:R:(C?/ (A+2) - 2C+A) 


R1=V2/T R1 
R2=V2/T R2 


FUNOTION EROARE (P, K, N, 0) 
DIMENSION P(K) 


۸1 = (S8 — K*K -- 9 * K + 2( # 9.125 
S2 = ) —3 a K s K — 6 s K + (۰ 


R = 0۷ )0.5 + )1-1(( + EXP (—Q. 5*0) 
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P(X? « c) prin 


A 1 

Rl = R ۰ )0 — A) 

R2 = R «(C«0| (A +2) —0—0 + A) 
3 IF(A.LT.2)G0 TO 2 


RI = R1/A 
R2 = R2/A 
PW ve 
GO TO 3 


2|| IF(K—K|2«2.NE.O) GO TO 4 
Rl = Ø. 797885« 1 
R2 = Ø. 797885" R2 
4 EROARE = (R1 * SL + R2 + §2)/N 
RETURN 
END 


unde: 


P — vectorul probabilităților (.P(I) > 0 pentru orice I) (real), 

K — dimensiunea vectorului P (intreg), 

N — numărul experienţelor (suma frecvenţelor) (întreg), 

C — constantă pentru pragul lui X? (real). 

Pentru a executa mai puţine operaţii, am împărţit termenii din 
parantezele drepte ale formulelor (2.12) şi (2.14) prin K + 3 suprimind, 
în acelaşi timp, K + 3 de la numitor. 

Presupunind K > 100 şi 0 avind 4 cifre semnificative ca si 
probabilitățile P(I) un program principal in care se apelează sub- 
programul EROARE este următorul : 


| DIMENSION 20100) 
| READ (1@5,1) K, N, C, (PU), I — 1, K) 
1 FORMAT (I3, 17, E11.4/ (TE 11.4) 
EROARE1 = EROARE (P, K, N, 0) 
WRITE (198,2) EROARE 1 
FORMAT ('_EROARBA LA APROXIMAREA LUI 
이 HIPATRAT ESTE', E13.4) 
STOP 
END 


bo 


Programul a fost scris pentru calculatorul FELIX-C-256. 
Cartelele de date vor conţine o primă cartelă pe care se perforeazá 
valorile lui K, N,C ocupind respectiv coloanele 1 —3, 4-10 si 11— 21. 
Pe următoarele cartele se pun probabilitățile grupate cite 7 (ultima 
grupă poate fi incompletă) si fiecare probabilitate se perforeazá în 
cite 11 coloane. La imprimantă apare valoarea calculată pentru 
eroare cu 4 cifre semnificative. 
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4. Parametrul ^ din teorema 5.4 poate fi calculat conform for- 
mulei (5.5) cu următorul subprogram funcţie numit ALAMB a 
cărui schemă logică este dată în fig. 1.4. 


FUNCTION ALAMB (P1, PO,K,N) 
DIMENSION P1(K), PO(K) 
ALAMB = Ø. 

DOI =<1,K 

P2 = P1(1)—P0(1) 


PO(1) 
unde : 


P1 — vector cu probabilitati (real), 
PO — vector cu probabilitati specificate 
în ipoteza nulă (POL) > 0 pentru 


ALAMB=ALAMB/N 


(RETURN orice 1) (real), 
Fig. 1.4 K — dimensiunea vectorilor P1 si PØ 
(intreg), 


N — numárul experientelor (intreg). 

5. O funcţie des folosită în statistică este funcţia lui Laplace 
® (x). Această funcţie este tabelatá si este folosită in calcule prin 
valorile găsite în tabele. Dar în cazul cind se lucrează pe calculator 
este de preferat de a calcula valoarea acestei funcţii într-un punct și 
de aceea, în continuare, vom da un subprogram funcţie FI care 
calculează valoarea (0) folosind formula 


x 12 
(10.1) (x) = 0,5 + i ۳ “at. 


y2x 
0 


Pentru calculul integralei vom folosi metoda Simpson de apro- 
ximare DORN, Me CRACKEN 1976, si anume integrala 


(10.2) 4 = | f(t)dt care este aproximatá prin 


0 


h ۱ NC 
Ix q Wo + 4y + 2Y2 + Ay. + 2 ۰.۰ + 


+ SU 1 ate 4Yn—3 oe 24 n-2 + 4Yn-1 zs Yn). 


D] n 
unde y; —Jf(z), ون‎ = 0, % = 8, h = Ta و‎ 844479 Fh, $4=0,..., 


p---- 1 ALAMB = ALAMB + P2 * P2|PQ(I) ۰ 
| | | ALAMB = ALAM B«FLOAT(N) 

l ALAMB=ALAMB+ RETURN 

| ㆍ [eun Pon END 

| 

tz 


n — 1, cu n par. Eroarea de trunchiere este dată de 


hA 
(10.3) en A TA AT. "Ou a Ea 


E E > : de 1 s 
iar eroarea de rotunjire din calcule este proporțională eu —. Tinind 
Bao 


a 
seama că în cazul nostru funcţia este f(x) = e ° iar valoarea lui 2 
în cele mai multe aplicaţii nu depăşeşte 3 am considerat că numărul 
de intervale n = 40 se situează în regiunea în care eroarea totală este 
mica. 
La calculul valorilor y, am folosit formula de recurenţă 


-x;h 
(10.4) Wiri =e + 6*۰ ۵ ^ cu y=1, 
۲ —x,h 
iar pentru e formula 
-— ' — xh 
(HDI QUU =p re cul pre t. START 


Am folosit aproximarea 


— a 0,132981 | 
3/27 H=X 120 


pentru constanta ce apare în fata sumei gi cu care, E 
de fapt, am înmulţit valorile lui y, Evitám astfel pai 
calculul de mai multe ori al funcției exponentiale تس‎ e 
EXP care, in general, necesita mult timp de calcul. E e 
Schema logică a subprogramului FI este dată în 2 
fig. 1.5. Ekse" 
| FUNCTION FI(X) ien) 
| H= Xø. 0و . , وا ] لس‎ 
| Bl = 9.132981 H | ere 
| FI = 0۰ 5. 1+ 1 | ۱ 
| E2=1. E1=E1:£2:E3 
B3 = EX P(—H + H * 0.5) E2=E2-E4 
|| H4 = F3 « 3 | ۴12 +۱ 
۱۰۱ DOE — 1,2 El=El-E2-E3 
El = Els B2 + H3 E2- ۸ 
E2 = E2 + 4 l EA 
sat : £ FI=FT+ 2E1 
FI = FI + 4. « El MOIS / 


L—— ل‎ 


El = El + H2 + E3 
E2 = E2 x 4 FI: FI-E1] 
FI = FI — El 


RETURN (RETURN) 


END Fig. 1.5 


1 ۲۰ o = FI + 2 1 
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unde 

X — argumentul funcţiei ® (real). 

Observaţii. 1) Subprogramul merge bine şi în cazul cînd valoarea 
lui X este un număr negativ. 

2) Dacă se doreşte modificarea numărului de intervale folosin- 
du-se de exemplu 2” intervale se modifica două instrucţiuni, şi anume 
in a doua instructiu ne se pune 2” in loc de 4 Q si în a opta instrucţiune 
n in loc de 20. Dacă numărul de paşi este dat ca parametru, prima, 
a doua şi respectiv a opta instrucțiune vor fi: 


FUNCTION FIX, N) 
H = X/(2. + N) 


| | 
| | 
| po روت زو‎ 
| | T RM P 


restul instrucţiunilor ráminind neschimbate. Motivele pentru care 
se modifică numărul de intervale pot fi următoarele : valoarea lui 
|X|>38, valoarea lui |X| foarte mică, micsorarea erorii rezultate, 
micşorarea timpului de calcul ete. 

6. Calculul valorii 7j_.(k — 1) se face plecind de la formula 


1 ۳ at "EX. d 
(10.6) سس‎ "DW | mi-e GG E 
2 f "( - 9 ۱ 0 


sau, notind y = xi_a(k — 1), obţinem 
y kos x k-1 


3 2 
a WE. SUE pog 
(10.7) |e" ON E | L 
X 
0 


Funetia T o vom calcula după formula : 


72 y 
(= — 1)! dacă n este par 


r (5) " 
MT d in l1 a 
: E — ۳ — 2) em Vx dacă n este impar 


(n > 2) 


€ 
a 


(10.8) 


k-1 
بخ‎ i A Y 
de unde pentru 2 * r( ^ ) rezultá formulele : 


다비 k-1Y_ ((k—3) (k—5) (k—7) ... 4.2.2. pentru k impar 
۷ 2 ) (k—7) ... 5.3.1. 27 pentru k par.- 


(am presupus k > 2). 
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Valoarea lui y o vom găsi prin aproximarea integralei folosind 
metoda trapezelor : 


h 
(10.9) I x ru T 25 d 2ys + ۰۰۰ + و29‎ + 2Yn-1 + Ya), 


unde y; sint definiti ca în metoda Simpson de la punctul precedent 
numai că numărul de intervale poate fi şi impar. Eroarea de trunchiere 
in acest caz este dată de formula 

2 


h 
(10.10) مه‎ x ——(b—a) M cu M = max (y'(£)) 
12 a<E<b ` 


iar eroarea de rotunjire este dată de formula 
10160 — a)? 1 


leg] < oes 
2 h 


(10.11) P=(K-3)/2 
unde e este eroarea relativă de ro- R=K-3 
GAMA=2 


tunjire dintr-o operaţie aritmetică, 
si y este media valorilor y;. 

Pentru functiile cu care lucrám 
noi si pentru intervalele folosite, 
eroarea totalá rámine micá dacá 
numărul pasilor este cuprins între 
10 şi 1000. 

Dacă dorim valoarea lui y cu 
aproximație de 1/100 vom folosi 
pentru A valoarea 0,01. 

Subprogramul funcţie pentru 
calculul lui yi ,(k — 1) Lam nu- 
mit HIPTAK gi schema logică a 
lui este dat in fig. 1.6. 


FUNCTION HIPTAK 

(A LPA,K) 

IP = FLOAT(K —3)/2. 

R = FLOAT(K)-—3. 

GAMA = 2. 

| LP (K.EQ.K/2*2) GAMA = 

1012.506628 

1 | IPF(R.LE.Q)GO TO 4 
GAMA = QA MA+»R 

RSR 2) 

GO TO Fig. 1.6 


A1= (1-ALFA) * GAMA-100 
X=0 


= 


saci 200 


CS 


X=X+0,01 
E1=E1. 2 
۴۰۳۰۲۰ E4 
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4 A1 = (1—ALFA) + GA ۰ 
هتکن‎ 

Bae 34. 

El = 1. 

E2 = EXP (—@. 005) 
3 IF (F.GT. A1) GO TO 2 
X=X+9.91 

El = El * 2 

F =F + Xxx Px 1 
GO TO 3 

2 HIPTAK = X 
RETURN 

END 


unde 
ALFA — pragul de semnificaţie (0 < ALFA < 1) (real), 
K — numărul capetelor de intervale (întreg). 


x 


Ca şi la punctul precedent, pentru calculul valorilor lui e “am 
folosit un procedeu iterativ care evită folosirea funcției exponentiale 
EXP de mai multe ori. 

Observație. Dacă se dorește modificarea pasului de iteratie in 
calculul integralei pentru mărirea sau micşorarea preciziei se fac 
următoarele modificări. În instrucţiunea a 10-a se înlocuieşte 100 
cu valoarea lui 1/H, în instrucţiunea a 14-a se înlocuieşte — 0.005 
cu valoarea lui — H/2 iar în instrucţiunea a 16-a se înlocuieşte 
0.01 cu valoarea lui H. Dacă H se dă ca parametru, prima, a 10-a, 
a 14-a şi a 16-a instrucţiune se înlocuiesc respectiv cu următoarele 
instrucţiuni : 


| FUNCTION HIPTAK (ALFA, K, H) 
4|| Al (1. —ALPA)*GA ۲ 
| 2 = BXP (—H+®.5) 

24 


restul instructiunilor ráminind 1a fel. 

7. Verificarea normalitátii se poate face după procedeul expus 
în paragraful 6 (pg. 35). Subprogramul funcţie pentru verificarea 
normalitátii l-am numit NORVER cu schema logică in fig. 1.7. 


FUNCTION NORVER(X,N,K,ALFA,L) 


DIMENSION X(N), A(50), P(50), N1(50) 
XB =Ø. 
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1 


N 


22 


8 


(01 7-1 N 
XB=XB+ X) 
XB > XBJFLOA T(N) 


DO 21 - ۷ 

AS بت(‎ KB 

S=S+ Xl s X1 

S = SORT (S/PLOA T (N—1)) 

A(1) = XB — ٩ * FLOAT (K) + Ø.25 
KI - K2 

Sl = ۰۵ 

DO 31 =1,K1 

A (I+1) = A(I) + 1 


Q 


SINT’ |(1QF12.4)) 
DO41=1,K 

N1 (2) — 0 
DO51=1,N 

ES = 1 

Pa EK 

J —(LS + LD)y/2 

IP (L8.GT.LD) GO TO 7 
IP (A(J) — X(Z)) 8,5,10 
LS € Jut 

GO TO 6 


10 | ILD = J—1 


7 
5 


23 


9 


24 


GO TO 6 

dug 기이 

NUJ) = NI) +1 

WRITE (108,23) (N1(I), I = 1, K) 


0 (10 1 12)) 

Pn — 0. 

CONSE NE 

DO9I-—1,Kl 

FI2 = FI ((A(I) — X.ByJ8) 

PU) = FI2-FN 

FI = FI2 

P(K) = 1. -1 

WRITE (198, 24) (PU), I — 1, E) 


WRITE (108,22) (A(1), I = 1, K1), A(K —1) 
FORMAT ('.CAPETELE FINITE DE INTERVALE 


FORMAT ('_.FRECVENTELE PEINTERVALE SINT: 


FORMAT ('_PROBABILITÁTILE CALCULATE PE IN 


C TERVALE SIN T'| (10 F12.4)) 
XP = HIPT (N1, P, K) 
XP1 = HIPTAK (ALFA, K —L) 
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FI2=FI((A(1)-XB)/S) 
Pl): FI2-F]1* 


S=S+[X(1)-XB) 


Al1)= XB-S-K/4 


'E (108, 25) XP, 221 d 
FORMAT (..VALOAREA HIPATRAT GASITA ESTE: 
cl, 2.4. .VALORBA HIPATRAT CALCULATĂ ESTE وه‎ 


۱ | (IF (XP. GI XP1) GO TO 11 

INORVER = 1 
WRITE (108, 26) ۱ 
FORMAT (IPOTEZA ESTE ACCEPTATĂ”) 


¡RETURN 
11 | I¡NORVER = 2 
| [WRITE (108, 27) à 
97 | (FORMAT ('_IPOTEZA ESTE RESPINSĂ’) 
| (RETURN 
IEND 
l unde: 


X — vectorul ce conţine valorile de selecție (real) 

N — numărul de elemente ale lui X(întreg). 

K — numărul de intervale (întreg) 

ALFA — pragul de semnificație (real) 

L — numărul gradelor de libertate (întreg) 

Au fost folosite subprogramele funcție de tip real expuse în 
prezentul paragraf : 


FI — pentru calculul valorilor funcției lui Laplace 

HIPT — pentru calculul valorii lui X? 

HIPTAK — pentru calculul valorii lui Xî_a( —1—7) 

Am presupus că numărul de intervale este mai mic sau egal cu 
50. Dacă numărul de intervale depăşeşte 50 trebuie să se modifice 
a doua cartelă a subprogramului punîndu-se în loc de 5Ø un număr 
mai mare sau egal cu numărul de intervale dorit. 

Subprogramul precedent poate fi folosit cu un program prin- 
cipal ca cel care urmează : 


| ¡DIMENSION X (2000) 
READ (105,11) K,L,ALFA,N 


| 1 | |FORMA 7013, F10.4,14) 
| | READ (105,2) X(1), I =1,N) 
و‎ | [FORMAT (8F10.5) 


INI = NORVER(X,N,K,ALFA,L) 

¡STOP 

¡END 

Ca rezultate vor apare în ordine la imprimantă următoarele : 
— capetele finite ale intervalelor 

— frecvențele pe fiecare interval in parte 


| 
| 
| 
| 
| 


5 = c. 271 65 


— probabilitățile calculate pe fiecare interval 

— valorile lui X? și y?_.(K—1—L) 

— dacă în urma calculelor făcute IPOTEZA ESTE ACCEP- 

TA TA sau IPOTEZA ESTE RESPINSĂ 

Cartelele de date vor fi perforate în felul următor : pe prima 
cartelă vor apare valorile lui K (primele 3 coloane), ale lui L (coloanele 
4— 6) valoarea lui ALFA (coloanele 7 —16 dintre care ultimele 4 sînt 
partea zecimală dacă nu apare punctul zecimal) 81 valoarea lui N 
(coloanele 17 —20). Pe următoarele cartele sint trecute elementele 
vectorului X, cite 8 pe o cartelă, fiecare ocupind cite 10 coloane iar 
ultimele cinci cifre vor fi partea zecimală (dacă nu apare punctul 
zecimal). Ultima cartelă de date poate să fie incompletă. 

8. În programul precedent am presupus că valoarea lui K este 
indicată pe cartele. Plecind de la formula (6.10) si presupunind b =4 


: 1 x : 
Bi no = 7 unde rezultă ®-(z,) = 0 putem calcula valoarea lui 


K din formula : 
7 2/5 
S sd es A- | 
Ua 


unde u, rezultă din relaţia 
®(—u,) = « 
si tinind seama de expresia lui O putem determina pe u, din egalitatea 


u 
a 


| e “dt = Vaz 


0 


1 
A — — 
2 


(în formula pentru K nu contează semnul lui Ua, puterea la care se 
ridică fiind pară, de aceea am luat modul în partea dreaptă si consi- 
derám u, > 0). 

Pentru găsirea efectivă a lui u, vom proceda ca în cazul găsirii 
lui Xi-a(K—1) (vezi funcția HIPTAK) aproximind integrala prin 
metoda trapezelor cu pasul 0,01. 

Astfel obţinem subprogramul funcţie K1 a cărui schemă logică 
este dată în fig. 1.8. 


FUNCTION K1 (N, ALFA) 
A = 2.596628«(ALFA — 0.5) 100 
IP (A. LT.O)A = —A 


UALFA = 0. 
FI = 5 
EY 그, 
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2 | IF (FI.GT.A) GO 1 


E2 = 1. | 
E3 = EXP (-0.00005) 


A=V2TT (-1/2)-100 


El = El x H2 * ES 
E2 = E2 + 4 
FI = FI + El 
UALFA=UALFA + 0.01 
GO TO2 
1 | |K1 = IPIX ((1.414213 x FLOAT 
C(N—1)/UALFA)*x0.4+4) 
RETURN 
END 
unde : 
N — volumul selecţiei (întreg) 
ALFA — pragul de semnificaţie 
ng incipal ce folo 
rogram principa - 
eta و کی‎ ama K1 A NORVER 
(deci si FI, HIPT, HIPTAK) este 
următorul : 
DIMENSION X(2000) 
READ (105,1) L,ALFA,N RETURN 
1 | ¡FORMAT (3X, I3, F10.4,14) Fig. 1.8. 
REA D (105,2) (X(I), I = 1,N) 
2 | IPORMAT (8F10.5) 
K = K1 (N, ALFA) 
NI = NORVER(X,N,K,ALFA,L) 
STOP 
END 
Cartelele de date si rezultatele obținute sint la fel ca la, programul 
de la punctul 7 în afară de faptul că nu mai sint luate în considerație 
coloanele 1—3 corespunzătoare valorii lui K pe prima cartelă. 
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DA 8 1 1 0 ۱1۰ 2 


TESTE DE CONCORDANȚĂ PENTRU REPARTITIILE GAMA 
ŞI EXPONENȚIALĂ 


Introducere 


in acest capitol vom prezenta un test de concordanță pentru 
repartitiile gama şi exponențială care înlătură neajunsurile testului 
X? în cazul continuu. Dat fiind faptul că repart titia exponențială este 
un caz particular al repartitiei gama, s-ar părea cá este-lipsit de sens 
construirea separată a unui test de concordanţă pentru repartiţia, 
exponențială. Nu este asa, deoarece repartiția exponențială are 
multe aplicaţii în practică si metodele folosite în determinarea sta- 
tisticii test sînt diferite de cele topite pentru repartiţia, gama, Sta- 
tistica pe care o preze ntám se bazează pe estimatorii de minim X? 
generalizati şi este notată prin 0. 


2. Rezultate asimptotice privind repartiţia vectorilor de 
momente si funcţii de momente 


Bye Lo Aa a selecție asupra unei variabile aleatoare X 
cu densitatea py(w, 0) unde 0 = (6,, 6,, ...,0,) este vectorul para- 
metru (ipoteza H,). Cu notatiile 


۵ -— (my, ims, « 25 704) 

Pi = Cui, ps. ]5), e > q fixat 

he Bem, MN) 

Ce = Pa (uty tay >, n) 1=1, و2‎ S 
A o A) 

4 (či Cs, و‎ Es) 


au loc propoziţiile 
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Propozitia 2.1. Dacă există us, atunci, asimptotic, 
/n(b — B) ~ N (0, 6), 


+ A a. ㆍ , ¡LA 
G avînd elementele definite că gi; = Vies — Vita 
Propoziția 2.9. Dacă există (06,015), atunci, asimptotic, 


|n (h — 9 ~ N (0, E) 
unde 


E = J63’ 


s ۱ n 
J fiind matricea sxs cu elementele )۵ 0۰ 

` Observatie. Am notat cu s numărul momentelor pe care dorim 
să bazăm dec sizia. ۱ 
| cazul în care t, sînt combinaţii liniare de componen- 


tele tui V: k 


„unde W este o matrice s Xq de constante cunoscute, 
de rang g. | Us A 
Obtinem rezultate asemănătoare aceluia din propoziţia 2.2. 


ponies repartitiile gama si exponențială. 
Pentru repartiţia gama de densitate 


(2.2) py 1 0) == ph مسب‎ 27911۵ 2 << 004,055) Os رم‎ 0 
i (9) 

exprimăm vectorul £ cu ajutorul cumulantilor care vor fi functii 
liniare de parametri 0 = 0,0, 07 = 02. ES 

Definiția 2.1. Cumulantii 96, Az, ...,9(, ... sint definifi de 
identitatea în t 

3t sl a Ra ali | ET iy Bal? vis d 

exp fart } i I Sed - uat H 27 E crc m 


Observatie. Cumulantul &, este coeficientul lui (it)'/r !in Ing z(t), 
dacă dezvoltarea in serie de puteri există. 


Lema 2.1. Avem 


j-1 
T 시기 
(2.8) 에, = up — Y, Cf ha A, 
i=l 
particular 
A = ua 
ec , oy 
وا‎ = py — pie, 
roy > P) 
3 Ka 1396, — 21106 
, 
8, = pa uad, — Spada — 34,3%, 
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Propoziția. 2.3. Pentru densitatea (2.2), avem 
A, =(F*—1)10,0%, r=1, 2, +... 


Observaţie. H, si K/K,- r=2,3,..., s sînt funcții liniare 


de 0f gi 07: 


% at K 
A, = 0,0, = 0f, —. = 0, = 0f, — — 20, = 905, ..., ل‎ = 
Hy 2 3t, و‎ 
= و) =—— ,0% )2 — و)‎ — 1) 07 
«=1 


Deci 
이은 09, la NO 의 E 


gi prin urmare, dacá luám 


bea = (8 — 2) OF, Cs (s — 1)0F‏ و. 


* 
(2.4) E ÓN 0 0 ) DM bed 
از‎ ME WAREN e RE | 0f 
obtinem 
6 — We*. 
Componentele vectorului h sint 
(2.5) ha = ky, hi = kı 2499 95 23 
ba 


unde k; este cumulantul de selecţie de ordin i al variabilei X de den- 
sitate (2.2). 

Trecem de la vectorul b’ la vectorul (k,, ka, .. 
vectorul h'. 

Sintem în condiţiile propozitiei 2.2. Deci, are loc 

Propoziția 2.2. Dacă variabiva aleatoare X are o repartitie gama 
cu densitatea (2.2), atunci, asimptotic, 


Jn (h — 6) ~ N (0, E) 


., k,) si apoi la 


unde 
bs = JJ GJJ; 


elementele (i, j) ale matricilor Jacobian 3, si J, fiind date de 
09/0 și respectiv 009 


Propoziția 2.4. Pentru variabila aleatoare exponențială cu den- 
sitatea 


(2.6) Px (%, 0) = و‎ 220,00 
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avem 
pe Seah pulo e ACH r at 


Observaţie. ui şi usuca, 7 = 2, 3, ..., 8 sint funcții liniare de 0: 


, 
_Hs-1 


2 ۳ 
pi = 0, = 20, ..., ل‎ = (s — 1) 0, - 븐 - = 80 
Ma s-a Paci 


Deci 
ی ات بط‎ & = 20۰۰ 0.1 = (6 — 1) 0695, — 80 


şi, prin urmare, dacă luăm 


(2.7) W (1 DE 9 =L:8) 
putem scrie و‎ = WO. 

Componentele vectorului br sint 
(2.8) JG — oh LX Le و و شرت‎ 


Sîntem în condiţiile propoziției 2.2. Deci are 100 
Propoziția 2.2". Dacă variabila aleatoare X are densitatea (2.6), 
atunci, asimptotic, 
Vn (h — ح(ع‎ N (0, E) 
unde 
E = JOJ 


elementul (i, j} al matricii J fiind 060). 


3. Statistica 0 şi repartiția sa asimptotică 


3.1. Definiţia statisticii Q 


pl . 
Statistica Q are expresia, 


(3.1) Ò = nh’ Ah 
unde ik. 1 
(32 — À = $- (1 — R), R= W(W £t W)-! WÊ-1, eu 


È estimator consistent pentru E care nu este singulară, şi se obţine prin 
minimizarea, în raport cu 0, a tormei patratice 
(3.3) Q = n(h — W0)'Z-'(h — Wo) 
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Observaţie. Estimatorii obţinuţi in acest mod poartă numele de 
estima ㆍ de minim X? ger zaji 
Valoarea 6 a lui 0 care n e Mist 4 pe Q este 
/ Ld DIT/ T A 
3.4) 0 = (W x-i W)-1 W' 3-1 h 


2 T ntry ^amorntitia o y 
3.1. a Pentru repartiţia gama 


(3.5) 

1 A / , 
unde 0* = (k, Kalk)’. 

Deoarece in acest caz nu convin estimatorii de verosimilitate 
maximă, pentru a estima pe E folosim estimatorii consiste iti bazati 
pe primele două momente. 

3.1. b Pentru repartiția exponențială 


x ERE 
(3.6) 2= [Elo 


unde media de selecţie m', este estimatorul de verosimilitate maximă 
pentru 0. 


3.2. Rapariifia as] ۸۱۱۵۰۱1 a statisticii Q 
Teorema 3.1. Dacă X are densitatea de repartiție p y(w, 0), 9 
q-dimensional (ipoteza nulă Hj), atunci, pentru valori mari ale lui n, 


^ و‎ - 1: 
Q ~ Y dix'(l, as) 
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unde di, do, ..., d, 4, sint rădăcinile caracteristice ‘nenule ale matricei 


A* obținute prin înlocuirea. lui È prin X*, X* fiind un estimator con- 
sistent pentru E in PR alternativă H, conform căreia X are densi- 
tatea de repartiție py(x, y), y p-dimen: oa. 

Arătăm cum se obtin parametrii de necentricitate a,. 

În ipoteza H,, pentru valori mari ale luin, h~ N (CO, (1/n)20). 
Considerăm o matrice T nesingulară si P o matric e: ortogonală asttel 
încît 


TEOT = I P(T)2A*TAP' = D 


unde D este diagonală. Dacă ربا‎ este componenta j a lui y = ۳160, 


atunci a, = Va. = 
3.2. a Pentru repartiţia gama q — 2, Q are sens pentru orice 
$ > 2 si asimptotic are o repartiție y?(s — 2). 
. b Pentru repartiţia, exponențială q — 1 (un singur para- 
metru) Q are sens pentru orice's > 2 fixat si asimptotic are 0 re- 
partiție y?(s — 1). 


3 
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A 
4. Q test de concordanță 
1a |exponentia 
5 e ON Taped 
x^ (s — 2) [x 


Puterea tes de ajustare Q 


v 
Y ^ 
) este invariantá in raport cu par 


al repa 


i A testului be azat pe tisti ica 


; I P 3T " 

(4.1) PIV d, 3? (1, aj) > ES E 
1 
Q avind 1 repartiţia asimptotică data de teorema 3.1. 
x , A 

4.4; Pentru a studia puterea testului Q pentru repartiția gama 
am consider ; alternativele 

A.1. Weibull 


Yı æ ۱۷۲: r BA 
1) (a, y) x کک‎ d ML Ric [주 3d >0, "fiiya >0 


Cum ya (e) este parametru de scară in Al (A2) urmează (din 
teorema, 4.1) că puterea, pentru repartiția gama, este aceeaşi pentru 
orice valoare a lui y,. 

Din (4.1) gi din teorema 3.1 am obţinut tabelul 4.1. 


Tabelul 4.1. 
A 
Puterea testului de ajustare Q pentu 1cŢartiţia cama (Pagul de semnificatie a= 0,05) 


Alternativa A, 


n = 50 100 
Yi "mug | 4 3 | 4 Yi 


0,25 | 0,995 | 1,000 , 1,000 0 
0,50 | 0,758 | 0,971 0,759 0,971 0 
0,75 | 0,278 | 0,488 0,284 0, 494 0, 
0 
0 
1 


Alternativa A, 
n= 50 100 


1,00 | 0,050 | 0,050 0, 050 0, 050 
2,00 | 0,021 | 0,011 0,067 0,038 
3,00 | 0,139 | 0,525 0,394 0,623 
4,00 | 0,318 | 0,852 0, 659 0,956 
5,00 | 0,448 | 0,594 0:777 0,888 
7,00 | 0,577 | 0,611 0, 843 0,873 
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Pentru A.1 puterea, descrește (creşte) cînd y, creşte pentru y, < 1 
(pentru y,>1). Pentru y, = 1, A.1 devine repartiţia exponențială 
(caz particular al repartitiei gama) si puterea coincide cu pragul de 
semnificaţie. 


Aceasta este şi explicaţia de ce puterea este mică pentru y, 
apropiat de 1 şi de ce curba puterii are formá de U atit pentru و‎ = 3 
cît şi pentru s = 4. 


O altă alternativă este 
A.3 Beta inversă 


ara + 2) mitra, 2 >0, vi 0 
BlY1, Ya) 


şi pentru a putea folosi teorema 3.1, presupunem y, 6 (y, > 8) 
în cazul s = 3 (s = 4). În acest caz puterea este putin sensibilă la 
schimbările valorilor lui y, si descregte cînd y, creşte. 


Tabelul 4.2 


A 
Puterea testului de ajustare Q pentru repartiţia gama (pragul de semnificație x — 0,05). 
Alternativa A, 


Ya = 5 yi: = 1,0 

Ya n= 50 100 50 100 

4 3 4 3 4 3 4 | 29 و 

7 | 0,860 | 0,860 0,865 0, 865 

8| 0,758 0, 759 0,765 9,767 

9| 0,669 0, 984 0,670 0, 984 0, 678 0, 984 0, 680 0, 984 
10 | 0,593 0, 956 0,595 0,956 0,603 0,956 0,606 0,957 
12 | 0,475 0,877 0,477 0,878 0,485 0,876 0, 489 0,878 
15 | 0,359 0,740 0,361 0,741 0,368 0,737 0,372 0,739 
20 | 0,252 0,546 0,254 0,547 0,259 0, 539 0,262 0,543 
25 | 0,196 0,414 0,197 0,415 0,201 0, 408 0,203 0,410 
30 | 0,163 0,328 0,164 0, 329 0,166 0,322 0,168 0,324 

Yi 3,0 Yr = 5,0 

7 | 0,86 0, 877 0, 883 0, 883 

8| 0,784 0, 787 0,794 0, 798 

9| 0,701 0, 984 0, 707 0,984 0,715 0, 984 0,723 0, 984 
10 | 0,630 0, 956 0,638 0,957 0, 646 0, 956 0, 658 0, 958 
12 | 0,515 0, 874 0, 627 0, 879 0,534 0, 873 0,552 0, 881 
15 | 0,396 0, 728 0, 410 0,73 0,416 0, 724 0,438 0, 740 
20 | 0,267 0,523 0,275 0,534 0,297 0,514 0,318 0,533 
25 | 0,231 0, 389 0,250 0, 399 0,230 0, 379 0,247 0,395 
30 | 0,217 0,305 0,227 0,312 0,189 0,294 0,202 0, 307 
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4.b. Pentru a studia puterea testului Q pentru repartiția expo- 
nentialá am considerat alternativele : gama de densitate (2.2) cu 
0, = yı 0; = ya şi A, (din 4a). 

În tabelul 4.3 se dă puterea atît pentru alternativa gama cit şi 
pentru Weibull. Puterea este aceeaşi pentru toate valorile posibile 
ale lui y,, deoarece acesta este un parametru de scală atit în alterna- 
tiva gama cit si in alternativa A,. 


Tabelul 4.3 


A 
Puterea testului de ajustare Q pentru repartiţia exponențială 
(prag de semnificatie a = 0,05) 


Alternativa gama | Alternativa Ay 

0,25 0, 991 0, 999 0, 998 1,000 | 0,25 | 1,000| 1,000| 1,000| 1,000 
0,50 0,896 0,955 0, 967 0, 988 0,50 | 0,999] 1,000) 0,999) 1,000 
0,75 0, 421 0, 509 0, 545 0,627 || 0,75 | 0,888} 0,972) 0,942] 0,986 
0, 80 0, 303 0, 307 0, 392 0,458 || 0,80 | 0,773| 0,907| 0,857| 0,945 
0,90 0,129 0,151 0,149 0,171 0,90 | 0,350| 0,481| 0,414| 0,535 
1,00 0, 050 0,050 0,050 0,050 1,00 | 0,050| 0,050| 0,050| 0,050 
1,25 0, 031 0, 019 0, 076 0,052 | 1,25 | 0,059) 0,031| 0,263| 0,175 
1,50 0,067 0,039 0, 275 0,210 | 1,50 | 0,324| 0,211| 0,917| 0,845 
1,75 0,145 0,092 0, 613 0,531 | 1,75 | 0,727) 0,583| 0,999| 0,997 
2,00 0,273 0,187 0, 876 0,827 | 2,00 | 0,940| 0,866| 1,000| 1,000 
2,50 0, 604 0, 482 0, 997 0,994 | 3,00 | 1,000| 1,000) 1,000} 1,000 
3, 00 0, 852 0, 761 1,000 1,000 

5,00 1,000 | 0,999 | 1,000 | 1,000 | | 

7,00 1,000 1,000 1,000 1,000 | | 


1 


Pentru alternativa gama puterea descregte (creşte) cînd y, creşte, 
pentru y, <1 (y, > 1). De asemenea, puterea coincide cu pragul 
de semnificație « = 0,05 pentru y, = 1, deoarece repartiţia gama se 
reduce la repartiția exponențială pentru y, = 1l. Aceasta explică, 
de asemenea, de ce puterea este mică pentru v, apropiat de 1. În 
cazul în care y, > 1 obţinem că puterea testului Y bazată pe s = 4 
este mai mică decit a testului corespunzător bazat pe $ = 3. 

Repartiția Weibull se reduce la repartiţia exponențială pentru 
Yı = 1 gi aceasta se reflectă în faptul că puterea coincide cu pragul 
de semnificație a = 0,05 cînd y, = 1. 
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CAPITOLUL 3 


TEST DE AJUSTARE PENTRU REPARTITIA BINOMIALĂ 


1. Testul C(%) pentru alternative binomiale corelate 


Considerăm un experiment în care răspunsul ia forma unor 
proporţii si fie p; = «;/m, frecvența răspunsului i —1,..., M. 
Daca este adevărat modelul binomial corelat, logaritmul funcţiei de 
verosimilitate este 3 1 


y e M 
L-— K + Y (vlog p + (m, — a) log q; + 


t=1 


M 
+ Y log | 1 + ot = (2, — mp)? + z(2p — 1) — np?) | 
go 2p?g* 
unde q = 1 — p şi K este o constantă ce depinde numai de observaţii. 
Se obţine un test de ajustare pentru repartiţia binomialá verificind 
ipoteza nulă : ۱ | 
Hy: == 0 in prezenta parametrului nedorit p. 

Moran (197 0) demonstrează că pentru astfel de probleme, testele 
C (a) propuse de Neyman (1959) sint asimptotic echivalente cu testele 
ce folosese estimatorii de-verosimilitate maximă. 

„Statistica test C(«) pentru Hy: = 0 necesită următoarele 
derivate parţiale ale lui L evaluate in < —0: 


(1.1) ۸ z 01, c f 91 
SANA Jo = Sa —NpY,+ 24(2p — 1) — nep?2)/(2p2q2), 
Jo-0 i=1 


62L My 
Sap) = B | RISE y [pgín, — 1)(a, — mp) + 
@=0 $=1 


0 Q9 p 
(1.2) 
+ (q — p)i(a, — mp)? — aqq + pla, — 4p); ]/(p?q?), 
Sep PNE Wig M ES 
Sip) = E quam (a, — mp) + @{2p — 1) — np**/(4p'q*). 
(1.3) 
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| 
| 


i 


= 0, 2, sînt variabile alea- 
toare independente binomiale şi din (1.2) rezultă 


Dacă este adevărată ipoteza nulă Ho : 


M 1S4(p); Exo). 


Neyman (1959) a arătat că atunci cînd M {S,(p)} = 0, ipoteza 
nulă H, : e = 0 poate fi verificată cu ajutorul statisticii S;(p), unde 
p este rădăcina de ordin n a estimatorului consistent pentru p (Mo- 
ran (1970)). Înlocuind estimatorul consistent 


„n (1.1) şi definind 


i 

(1.4) S = y (vi — mp) D), 
găsim că statistica test O(a) este dată de 
(1.5) Sp) = )8 — ۰ 


Deoarece M{S,(p)} = 0, dispersia lui S(p) este dată de —M{S,(p)}, 
unde media este luată in ipoteză Hy: ¢ = 0. Din (1.3) urmează că 


(1.6) — Mi8,(p)} = Y, nm — 1)/(2p?q?). 


wa ^ . . A vos M o^ 0 
Dacă în (1.6) înlocuim p prin p, găsim că în ipoteza Ho: 9 =0, 
statistica 


M > i M 2 M x 
(1.7) 23 = Ix (a, — PRD — Y, m} e Y nn — 2) 
ie £i í=1 


are asimptotic o repartitie y? (1). Statistica (1.7) este statistica test 
C (a) pentru omogenitatea proporţiilor care este asimptotie optim 
faţă de alternative binomiale corelate. 

Testul binomial al dispersiei pentru omogenitate este bazat pe 
statistica, 
(1.8) EY A mp)? (mpå), 


care, asimptotic, are o repartiție y? (M — 1) (cînd ọ = 0). 

n cazul în care n; = n pentru toți i, statistica S pe care se ba- 
zează testul O(a) este echivalentă cu statistica Xb. Asimptotic, testele 
bazate pe X2 şi X2 nu sînt echivalente, deoarece, asimptotic و2‎ ~ 
~ y*(M —1), în timp ce Xê ~ x*(1). În cazul în care n; nu sint egale, 
statisticile test S şi X? nu sint echivalente. 

Testul C(«) este bazat pe suma pătratelor abaterilor neponderate 
(2; — mp), in timp ce in X; fiecare pătrat al abaterii este ponderat 
cu 1/n,. 
— ” Haldane (1940) şi Cochran (1954) au indicat că pentru valori 
miei ale lui m, pot fi obţinute expresii mai precise pentru media si 
dispersia testului binomial al dispersiei, calculind momentele con- 
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ditionate fiind date totalurile marginale. Haldane obţine media si 
dispersia conditionate pentru testul binomial al dispersiei, iar Wis- 
niewski (1968) obţine expresii exacte pentru media şi dispersia con- 
ditionata a statisticii S pe care se bazează testul C(«). Cochran (1954) 
recomandă ca momentele condiţionate să fie folosite în cazul M > 30 
si n, > ۰ 


2. Testul C(«) pentru alternative beta-binomiale 


Repartiția beta-binomialá este o mixtură de repartitii binomiale 
care adeseori este folosită ca o alternativă la repartiţia binomială. 
Sub modelul beta-binomial, logaritmul funcţiei de verosimilitate 
este dat de 


M > (xi-1 nx - 1 ni—1 

LEX (E هم + معط‎ + 된 Tog +r0— Y log (+10), 
í=1 [| r=0 r=0 r=0 

unde K este o constantă care depinde numai de observaţii. 

Se obţine un test de ajustare pentru repartiţia binomialá veri- 
ficînd ipoteza nulă H,: 0 = 0. Obţinerea statisticii pe care este bazat 
C(«) folosind modelul beta-binomial este similară cu aceea folosind 
modelul binomial corelat, şi statistica optimă este statistica S obţinută 
în $1. Totuși, în modelul beta-binomial parametrul 0 nu poate lua 
valori negative. Ipoteza alternativă este necesar unilaterală şi deci 
testul O(a) este testul unilateral bazat pe statistica 


M M 1/2 
Z=(8— Sm) |f Es | 


i=l 


În ipoteza nulă H, : 0 = 0, statistica Z va avea asimptotic o repar- 
titie N(0,1). 

Potthoff, Whittinghill (1966) obțin un test local cel mai puternic 
(C.M.P.) pentru omogenitatea proporțiilor față de alternativa beta- 
binomială cînd p este presupus a fi cunoscut şi propun un test conser- 
vativ pentru cazul cînd p este necunoscut. 

Folosind o abordare grafică, Gart (1970) obţine un test al dis- 
persiei ca un test optim față de alternative beta-binomiale pentru 
cazul în care p este necunoscut sin, = n pentru toţi i. Testul O(a) 
bazat pe Z constituie un test pentru omogenitate care este asimptotic 
optim fata de alternative beta-binomiale în cazul general cu m, 
diferiți. 

Wisniewski (1968) consideră o clasă generală de alternative 
compusă din mixturi de repartitii binomiale. Cînd n, = n pentru 
toti i, el demonstrează că testul optim pentru omogenitatea seriilor 
binomiale fata de clasa sa de alternative este dat de testul dispersiei. 
În cazul în care n, nu sînt egali, Wisniewski sugerează că testul poate 
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AAA a a eg 


fi bazat pe statistica S obţinută anterior şi este folosit ca test asimp- 
totic optim faţă de alternative beta-binomiale. Cu metodele C(a) 
si factorizarea functiei de verosimilitate data de Wisniewski, urmeaza 
că statistica S este asimptotic optimă faţă de clasa sa generală de 
mixturi alternative. 


3. Testul C(x) pentru alternative de multiplicare Altham 


Neyman, Scott (1966) obţin un test al dispersiei pentru omo- 
genitatea repartitiei Poisson ca testul O(«) optim fatá de unele repar- 
titii alternative. Ei numesc această proprietate a testului de dis- 
persie, „robusteţea de optimalitate” (Moran (1973)). Obţinerea lui 8 
ca statistică test C(«) optimă pentru diferite alternative la repartiţia 
binomial’ sugerează că această statistică test C(x) pentru omogeni- 
tatea proporţiilor binomiale poate fi robust similar. ۱ 

Generalizarea multiplicativă a repartitiei binomiale sugerată de 
Altham (1978) dă o alternativă pentru care testul binomial corelat 
O(a) nu este asimptotic optim. Logaritmul funcţiei de verosimilitate 
pentru generalizarea multiplicativa a modelului binomial este 


M M M 
£=K+ y 2, logp + Y (n;— a) log (=p) + Y, ۷ —-9) log y — 
i=1 i=l ay 
M 
تن‎ y log f (; و‎ Ys Me), 
t=1 


unde y >0 si 
i 
fip, v, m) — Y Cp qe” PA 
r=0 


Se obtine un test de ajustare pentru repartiţia binomialá veri- 
ficind ipoteza nulă H,: y = 1. 

Logaritmul functiei de verosimilitate £ corespunde la modelul 
binomial multiplicativ cu acelaşi parametru vector (p, y) pentru 
toate volumele de selecţie »;. Altham (1978) a indicat că nu poate 
avea sens, din punct de vedere practic, de a ajusta modelul binomial 
multiplicativ cu acelaşi parametru vector (p, y) pentru volume de 
selecţie ce variază. 008. Ni 

Obţinerea statisticii C(«) în cazul binomial multiplicativ este 
mai complicată decit obţinerea ei în cazuri binomial corelat 81 beta- 
binomial; totuși, folosind metoda descrisă de Moran (1970) găsim 
că testul C(«) pentru H, : y = 1 este bazat pe statistica 


= Y, a(n, — a). 
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Spre deosebire de statistica O(a) binomial core R nu este echiva- 
lentă cu statistica pe care se bazează testul dispersiei în cazul n, = n 
pentru toţi ۰ 
Fie N = Yon, A = Y n(n, —1)3i B = V. nn, — 1)? 
şi să definim 
Lap) = (q — p)A, In(p) = pg( B + pq(24 — 4B)), 


Atunci, asimptotic, statistica 


(3.1) Xh =(R — APQY'Ua(2) — LADY IL AD) — y*1). 
Testul bazat pe X7, este asimptotic optim faţă de alternative 
date de generalizarea multiplicativă a modelului binomial. 

Altham (1978) a indicat că generalizarea multiplicativá a mo- 
delului binomial dă o dezvoltare a familiei exponentiale cu doi para- 
metrii, cu (Y, x,, R) suficientă pentru (p, y). Deoarece repartiţia lui 
R condiţionată de Y, ~, nu este o funcţie de parametrul nedorit p,- 
repartiţia exactă a lui (R| Y; «;) poate fi folosită pentru verificarea de 
ipoteze asupra lui y în cazul subasimptotic. În particular, repartiţia 
lui (E|Y, 4) pentru y = 1 poate fi folosită pentru concordanţă in 
modelul binomial. Cu toate că repartiţia condiţionată a lui Reste 
dificil de enumerat în cele mai multe situaţii, pot fi obţinute momen- 
tele condiționate exacte folosind metodele lui Haldane (1940). Pentru 
Y = 1, media $i dispersia lui R condiţionate de Y, v, sint 


u = NApQIUN — 1), 
a = NYA — 4B + 24)pâ(p — NG — N-9/Ne + 
+NBD4/(N — 1) — p’, ۱ 


unde 2۷۵ = N(N — 1)(N — 2)(N — 3). 

Pentru valori mari ale lui N, 

(R — u)*/ c? ~ ~ y*(1) în ipoteza nulă. 

În acord eu sugestiile lui Haldane (1940) şi Cochrar (1954), 
statistica, test ce utilizează momentele condiţionate exacte va fi 
utilizată în probleme în care M are valori mari si n, sînt mici. 

Exemplul 3.1. (Tarone (1979)). Ne propunem să verificăm ipo- 
teza conform căreia proporţiile 0/5, 2/5, 1/7, 0/8, 2/8, 3/8, 0/9, 4/9, 
1/10 şi 6/10 provin din observaţiile asupra unei repartitii binomiale. 
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= 19,03 şi P = 0,025; testul binomial 
i = 0,01, iar testul multiplicativ 
y P = 0,063. 

e acest exemplu, testul binomial corelat C(«) este 
sibil la de proporțiilor observate de la repartiţia 


iX y2 
~ 


FORT 


si subprograme FORTRAN privind testul de 
pentru repartiţia binomială 


Vom expune în continuare cîteva din subprogramele ce pot fi 
folosite la aplicarea testului de ajustare pentru repartiția binomialá 
și modul în care pot fi ele utilizate. 

1. Pentru calculul estimatorului consistent se poate scrie sub- 
programul funcție HS TCOW a cărui schemă logică este dată în fig. 3.1. 


|| FUNOTION ESTOON (X, N, K) (START) 
|| DIMENSION X(K), N(K) iE 
| y Ni=0] 
1۷1 == 0 X1=0] 
X1 = @. ve: 
۵ ار و‎ IE Bia) 1 
| wm Mate m 
E دا‎ i | NIS ۸1+ NI) 
|| ۸۷1 = ۸۲1 + ۷ )1( Xie XIX) | 
1 | Xi = X1 + 7 eee 
TX) eu rum 


ESTCON = X1/FLOAT (N1) 
RETURN 
END 


RETURN) 
Fig. 3.1 
unde 


X — vector ce contine valorile de selectie (real), 

N — vector ce conţine frecvenţe (întreg), 

K — dimensiunea vectorilor X şi N (întreg). 

Formula după care a fost calculat estimatorul consistent este 


?-(à*) 


6 — o. 271 81 


E LA 
à) 


2. Pentru calculul lui S din formula (1.4) se poate scrie subpro- 


gramul funcţie S a cărui schemă logică este dată in fig. 3.2. 


Fig. 3.2 


N1=N1+N(1) 
N2z:N2 « N(I) * NCID) 
X1=X1+X(1) 
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FUNCTION S(X, 2۷, K) 
DIMENSION X(K), N(K) 
۱ O 
P1 = ESTOON(X, N, K) 
DOLLS E 
X1 = X(I) — NU) 1 

1 S =S + X1*X1 

= S/(Pl«(1 — P1)) 


RETURN 
END 
unde : } 
X — vector ce contine valorile de selec- 
tie (real), 


N—vector ce contine frecvenţe (întreg), 

K — dimensiunea vectorilor X, N (întreg). 

În subprogram se foloseşte subprogramul 
funcție ESTCON prezentat la punctul 1. 

3. Valoarea lui X% se obţine din formula 
(1.7) din care rezultă subprogramul funcţie 
HIPTO a cărui schemă logică este dată în 
fig. 3.3. 


FUNCTION 27270 (X,N,M) 
DIMENSION X(M),N(M) 


+ == 
N2 = Ø 
KES 
DOLT = LH: 


Ni = ۷1 + N(I) 

N2 = N2 + N(I)*N(I) 
1 X1 = X1 + X(I) 

P = X1/FLOAT (N1) 
X2 = Ø. 


unde : 


DO 2 1=1,M 
X3 = X(1) — N(I«P 
2 | X2— X2. X3«X3 
X2 = X92/(P«(1.— P)) 
X929 = xs — wi 
HIPTO = X2«X2«0.5|FLOAT(N2 — N1) 
RETURN 


END 


X — vectorul valorilor de selectie (real), 
N — vectorul frecvenţelor (întreg), 
M — dimensiunea vectorilor X şi N (întreg). 


torul : 


Un program principal în care se foloseşte testul X2 este urmă- 


DIMENSION X(500),N(590) 

REA D(195,1) M,ALFA,(1),N(1), I = (X1, M) 
FORMAT (13,F7.4)(8(¥6.3,14))) 

X1 = HIPTO(X,N,M) 

X2 = HIPTAK (ALFA,2) 

WRITE(198,3) X1,X2 

FORMAT (VALOAREA LUI HIPATRATO :, F13.6/ 
VALOAREA LUI HIPATRAT ALFA :, F13.6) 
IF (X1.GT. X2) GO TO 2 

WRITE(108,4) 

FORMAT ('_IPOTEZA ESTE ACCEPTATĂ’) 
STOP 

WRITE (108,5) 

FORMAT ('..IPOTEZA ESTE RESPINSĂ”) 
STOP 

END 
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În program se ajunge la respingerea ipotezei dacă valoarea calcu- 
lată pentru X% este mai mare decit valoarea lui y2..,(1). Această din 
urmă valoare este calculată cu subprogramul funcţie HIPTAK 
prezentat în capitolul 1. 

Cartelele de date vor conţine o cartelă ce are în coloanele 1—3 
valoarea lui M gi în coloanele 4—10 valoarea lui ALFA din care 
ultimele patru reprezintă partea zecimală (dacă nu apare punctul 
zecimal pe cartelă). Pe următoarele cartele sînt reprezentate perechi 
de forma (X(1), N(1)) cite opt pe o cartelá (ultima cartelă putînd 
fi incompletă), X(I) ocupind 6 coloane (trei zecimale) iar N(I) urmá- 
toarele 4 coloane. La imprimantă vor apare valorile calculate pentru 
Xê Și xî-a (1) si rezultatul testului (ipoteză admisă sau respinsă). 

Observaţie. In subprogramul HIPTO se puteau folosi programele 
ESTCON şi S, dar am preferat să facem un subgprogram independent 
de acestea. 

4. Pentru calculul valorii lui X? dată de formula (1.8) am seris 
subprogramul funcţie HIPTV a cărui schemă logică este dată in 
fig. 3.4. 


FUNCTION HIPTV (X,N,M) 
DIMENSION X(M),N(M) 
N16 
E e eru |. X1 =9. 
۱ DOLE ند‎ EM 
N1 = N1 + N(I) 
1 Xl = X1+ X(1) 
P = X1/FLOAT(N1) 
Aa D 
| DO21—1,M 
| [X3= X11)-N01)-P] X3 = X(I) — N(I«P 
OSI M] Xs RBA 


[ HIPTV: X2/P-(1-P)] HIPTY = X2/(P « (1. — P)) 
RETURN) RETURN 
Fig. 3.4 END 
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inde : 

X — vectorul valorilor de selecţie (real), 

N — vectorul frecvenţelor (întreg), 

M — dimensiunea vectorilor X si N (întreg). 

Un program principal pentru folosirea testului X? este similar 
cu cel de la punctul precedent pentru folosirea lui X2 doar că instrue- 
(iunile a patra şi a cincea se inlocuiese respectiv cu instrucţiunile : 

41 = HIPTV (X,N,M) 
| X2 = HIPTAK (ALFA,M) 


iar in instrucţiunea a şaptea se pune HIPAT RATY în loc de HIPA- 


TRATO. Restul instrucţiunilor rămîn la fel şi reprezentarea datelor 
se face la fel. Ipoteza este respinsă dacă X? este mai mare decit 
Xî-a( M —1). Datele pe cartele si rezultatele la imprimantă sint la 
fel ca in programul precedent. 


5. Statistica Z poate fi calculată folosind subprogramul funcţie 


Z a cărui schema logică este dată în fig. 3.5. 


(START) FUNCTION Z(X,N,M) 
psg Cap | DIMENSION X(M),N(M) 
S=0 | = on 
N1=0 NY Y 
N2=0 E ۳ 
ea N2 = 0 
X2 = 0. 
70: eru DO11=1,M 
X2=X 2+) 1( X2 = X2 + AU) 
NI=N1+ NIIT) | N1 = N1 + N(I) 
| N2=N2 +۷۴ 
SMEs. eger ut 1| N22 N2 + N(D«N(I) 
P = X2[FLOA T (N1) 
9 l^ p DOSTE pow 
| ie یچ‎ a 
ERR AS: ad Bd Py e| 
S=SAP1-(1-P1)) S = S[(P«(1. —P)) 
X2=21N2 -N1) Ye N2— 
d X2 = 2.«FLOAT (N2—N1) 
= (8—N1)/SQRT(X2) 
RETURN 
Fig. 3.5 í END 
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unde ; 


X — vectorul valorilor de selecţie (real), 
N — vectorul frecvenţelor (întreg), 
M — dimensiunea vectorilor X,N (întreg). 


1 ds program principal în care se foloseşte statistica Z este urmă- 
orul : 


DIMENSION X(500),N(5bOO) 

READ(105,1) M,ALFA, (X(I),N(I), I = 1,M) 

1) | FORMAT(13,F7.4/(8(F6.3,14))) 

X1 = Z(X,N,M) 

X2 = UALFA (ALFA, @.5) 

WRITE(198,3)X1,X2 

3 | FORMAT (VALOAREA LUIZ ESTE, F13.6/ 
€| ‘.VALOAREA*LIMITA SUPERIOARA ESTE :, F10.2) 
IF(X1.GT.X2)G0 TO 2 

WRITE (108,4) 

4 | FORMAT ('_IPOTEZA ESTE ACCEPTATĂ’) 
STOP 

2| | WRITE (108,5) 

FORMAT (' _IPOTEZA ESTE RESPINSĂ’) 
STOP 

END 


= St 


În program se respinge ipoteza dacă valoarea calculată pentru 
Z este mai mare decît 41-ajz unde ما‎ rezultă din ecuaţia 


(4.2) goua SG 


Această valoare se poate calcula cu subprogramul funcţie 
UALFA prezentat în continuare (punctul 6). 

Cartelele de date vor conține o cartelă ce are în coloanele 1—3 
valoarea lui M 81 în coloanele 4—10 valoarea lui ALFA din care 
ultimele patru reprezintă partea zecimală. Pe următoarele cartele 
sînt reprezentate cîte opt perechi de forma (X(I), N(I)) (ultima 
cartelă putînd fi incompletă), X(I) ocupînd 6 coloane (trei zecimale) 
şi N(I) următoarele patru coloane. La imprimantă vor apare valo- 
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rile lui Z şi ale lui gre şi rezultatul testului (ipoteza este admisă, 
sau respinsă). 
6. Pentru găsirea valorii lui w,., din ecuaţia (4.2) am scris 
subprogramul funcţie UALFA 
FUNCTION UALFA(ALFA) 
A = 2.506628*x( ALFA —O.5)«100 
IF (A.LT.O)A = —A 
UALFA = 0. 
JI e 025 
dă ale 
02 = 고; 
E3 = EXP(—0.00005) 
E4 = E3xE3 
2 El = Elx ۷3 
UALFA =UALFA + 1 
FI = FI--El 
IF (FI.GT.A) GO TO 1 
B2 = 4 
GO TO 2 
1 IF (ALFA.LT.O.5)UALFA — —UALFA 
RETURN 
END 


unde : 


ALFA — pragul de semnificatie (real). 

Observaţie. Subprogramul UALFA are structură asemănătoare 
cu a programului K1 (capitolul 1) si de aceea am renunțat să-i dăm 
schema logică. 

7. Pentru calculul lui X?, se pleacă de la formula (3.1). Sub- 
programul funcţie pentru aceasta l-am numit HIPTM, iar schema 
lui logică este dată în fig. 3.6 
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N2-1) 


2-(N2-1)* 


M),NCM) 


Ai Ø, 


` DO1I=1,M 


N2 = N(I) 


R= R$ X(Da(N2—X(D) 

271 = N1 + N2 

_IA = IA + N2«(N2—1) 

_IB = IB + N2«(N2—1)4(N2—1Y 


X1= X14-X(I) 
P = X1/FLOAT(N1) 


eR d. روبق‎ 
۳2۱ 
۵-۱-۴ PL = +0 
PI=P:Q X12 = (Q—P)«IA 
X12-(Q- P)-1A — X11 = PI«(IB + Pl«(IA + ۸ 
Pee c| —4+IB)) 
HIPTM=(R-=1A-P1)2/ miata gee 
1(X11-X122 /X22) HIPTM=(R—IA+Pl)x*2/(X11 


c| —X12«.X12/ X22) 


RETURN 
Fig. 3.6 END 


unde 


X — vectorul valorilor de selectie (real), 

N — vectorul frecvenţelor (întreg), 

M — dimensiunea vectorilor X si N (întreg). 

Deoarece testul respinge ipoteza nulă dacă X2 este mai mare 
decit xi_„(1), ca gi în cazul lui X2 (punctul 3), programul principal 
pentru apelarea subprogramului HIPTM poate fi acelaşi ca pentru 
subprogramul HIPTC cu deosebirea cá în instrucţiunile a patra şi 
a şaptea apare M in loc de 0. Cartelele de date gi rezultatele la impri- 
manta sint aceleaşi. 

8. În aplicaţii este necesar de a se face o comparație între cele 
patru teste. Pentru aceasta se pot rula pe calculator programele și 


88 


ubprogramele prezentate anterior. Cum în formule există mai multe 
părţi comune, vom prezenta în continuare un subprogram, pe care 
£ 가나 + E 


l-am numit 
are se calculează valorile 23, Y? 
Xi-o(J£—1) și ua: La imprimantă, 


hal 


MAM / qe X e nud riS aet 34 H 2 $ 

TESTAJ şi a ci schemă logică este dată în fig. 3.7, în 
Pai Va. i ek EA pa 

„Z şi Xi, si valorile tabelate Xi-«(1), 


apar atit valorile calculate 


۱1 tabelate, cit şi rezultatul testului : IPOTEZA ESTE ADMISÁ sau 


RESPINSA 


SUBROUTINE TESTAJ (X,N,M ALPA) 
REAL*8 L(4),RE ۱ 
DIMENSION X(M),N(M) 

DATA N1,N2,N3,8,X4,X5,R,L,RE/3:0, 4«Q.., 
4v ADMISA' ,RESPINSA!)| 
X1 = HIPTAK(ALFA,2) 

X2 — HIPTAK(ALFA,M) 

X3 = UALFA(ALFAs@.5) 

DO1I=1,M 

X6 = X) 

N4 = N(I) 


XA — XA + X6 
271 = N1 + ۵۸ 

N2 = N2 + ۸ 

N3 = N3 + NAs(NA —1)««2 

P = X4/FLOAT(N1) 

Q1-p 

Pl = P«Q 

DO 21 ب-‎ 

X6 = X(1) — N(I«P 

ER X64 X6 

X5 = X5 +X6 

S = SX-X6 

B -- S/P% 

N2 = N2—N1 

XT = 2-4FLOAT(N2) 

HO = (S—N1)/X7 

HV = X5/P1 

HZ = HC+SQRT(X7) 

۲1 = (Q— P)«N2 

۲9 = Pls(N3-+ Pl«(N2--N2—4«N3)) 
Y3 = N1/P1 

14 —(R—N2«Pl1) . 

HM = Y4«Y4/( Y9— Y1« Y1/ Y3) 
WRITE(108,3)HO,HV,HZ,H M,X1,X2,X3,X1 
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eL 


N1=0 
N2=0 
N3= 0 
550 
x4=0 
X5=0 
R=0 
RE='RESPINS' 


X1=HIPTAK (ALFA, 2) 


X2=HIPTAK[ALFA,M) 


X3 = UALFA (ALFA/2) 


X6=X(1) 
NANI) 
R=R+X6:(N4-X6) 
X4=X4+X6 
N1= Ni» N4 
N2=N2+N42 
N3=N3+N4-(N 4-1)? 


X6=X(1)-N(1)-P 
X5 =X5 + X62 
S= S+X62 


55/۱ 
N2=N2-N1 
X7=2-N2 
HC=(S-N1)/X7 
HV=X5/P1 
XZ=HC-/X7 
YI=(Q-P)-N2 
۲2-2۱۰۱۸۱3۰ P1(2N2-4N3)) 
Y3=N1/P1 
HM=(R-N2:P1)2/(Y2 -۷۲7۷3( 


3| |FORMAT(/[21X,'I',5X,/ XO A5 X,'XV'A5X,Z' 16X; X M'] 
85((— J'VALOAREA CALCULATA 1',F12.5,3F17.5/ 


e 


€ VALOAREA TABELATA I'F12.5,3FAT.5/. REZULTAT, — 
C 12X, 'I^) | 
IF(HC-GT-X1)L(1)— RE 
IF(HV.GT.X2) L(2) — RE 
| LF(HZ.GT.X3) L(3) = RE 
IF(HM.GT.X1) L(4) — RE 
WRITE(108,4)L 
4| [FORMAT ('+",22X,4(48,9X)) 
RETURN 
END 


unde : 


X — vector ce conţine valorile de selecţie (real), 

N — vector ce conţine frecvenţe (întreg), 

M — dimensiunea vectorilor X, N(intreg), 

ALFA — pragul de semnificaţie (real). 

În subprogram se folosese subprogramele funcţie HIPTAK 


(cap. 1, pet. 6) şi UALFA prezentat mai sus la pet. 6. 


Un program principal in care se foloseşte subprogramul TESTAJ 


este următorul : 


DIMENSION X(500),N(500) 

READ (1@5,1)M,ALFA,(X(1),N(I), I = 1,M) 
1 [FORMAT (13,F7.4[(8 (F6.3,14))) 

CALL TESTAJ (X,N,M, ALFA) 


Datele se prezintá pe cartele la fel ca la punctul 3, iar rezulta- 


tele sînt tipărite in subprogram. 
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CAPITOLUL 4 


TESTE DE AJUSTARE PENTRU REPARTITIA POISSON 


1. Introducere 


Repartiția Poisson este folosită i) ca o aproximaţie a repartitiei 
binomiale ii) cînd evenimentele se realizează aleator in timp iil) 
pentru a descrie experimentele în çare variabila observată este un 
număr. Cea mai importantă aplicaţie a tipului ii) este. folosirea pro- 
ceselor Poisson în teoria firelor de aşteptare. 

Repartiția Poisson se bucură de următoarele proprietăţi 

Propoziția 1.1. Dacă X are o repartiție Poisson de parametru 
A(X ~Po(dA)), adică 


atunci 
a) MX) = D(X) = x 
b) X, = A pentru toți r. 
Propoziția 1.2. Dacă X,, Xa, ..., X, sînt variabile aleatoare inde- 


pendente repartizate Po(r,), Polha), ...; respectiv Po(,), atunci 
h 


E 
رز‎ X~ Pol Y 2l 


1 13 
Propoziția, 1.3. Dacă X,, X,, ..., X, este o selecție asupra varia 
E 1 2) / n f 
n 
bilei X ~ Po(2), atunci X, = Y, X, este o statistică suficientă pentru 
1 


A si complelá. 
Plecind de la aceste proprietăţi ne propunem sá dăm teste de 
ajustare pentru repartiţia Poisson. 


2, Teste de ajustare în cazul selectiilor complete 
j $ 
Deoarece cumulantii de selectie k, sint esiin atori receplasati 
pentru cumula nţii populaţiei A, si X, = ^(y1crozitia IT Mk,) RE 
pentru toţi j. Urmează că abaterea cun ulantilor k; de la media de 
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selecţie va fi o statistică convenabilă pentru un test de ajustare pentru 
repartitia Poisson.'Sintem in conditiile teoremei Rao-Blackwell (Mihoe, 
Craiu (1976)), ceea ce ne permite să afirmăm că 


(2.1) M(k,| X. = 2.) = 8,(a.) 


(3,(z.) fiind o funcție de æ.) este un estimator nedeplasat si de dis 
persie minimă pentru 2. 
Cum repartiţia Poisson este completă, 


3,(z.) = & pentru toti j si M(k,| 2) = Z. 


Testul de dispersie pentru omogenitate este bazat pe statistica 


€) € Be usd 2 TP 

(2.2) 수 오자 
77 
unde 

ma — (mi)? , d m 
[HP NE een x My ~= NEC 

Tk tk mF 

Avem 


Mai general 


x es kd j 
(2.3) D*(k,— X) = D2(k,) + DX) — 2 cov (kj, X) = Y AY, 
r=1 
unde A,, se găsesc din cumulatii de selecţie ai k-statisticilor. 


(2.4) MAIN) — X, r= 1, 2, 


gi ey Th ee a e 
4 


Din (2.3) şi (2.4) găsim că 


m Yr Se 


A - EJ 1 A A - — 
(2.4) Why X) = Y لت‎ em ور 2 رز‎ | DAE, — X)) 


r 


P2 n 


este un estimator nedeplasat pentru D?(k, — X) iar din teorema 
Rao-Blackwell că este de dispersie minimă. 
Deoarece 
M(k, — X| 2:) = 0, 
urmează că 


(2.5) — D*k, — X) = M(M[(k, — X)?| w.]} = MDX k,| 2.)). 


M(E(k, — X) — D%k,| z.)] = 0 
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Deoarece repartiţia Poisson este completă, singura funcţie de X. 


avînd valoarea medie zero este funcţia identic zero. 
Prin urmare 


D*(k,| æ.) = E(k, — X). 


Avem 
= 2663 KH 8 23 
(28) 4e Ry LA po g Me 6 dia 이 세 
n—1 n n n n— i 
şi 
۱ 220 : 
(2.7) D*(k,| 2.) = — — (din(2.4)). 
n:n? 
Analog 
182% 65 
(2.8) DRE m - — , 
n.nO n.n a 
şi 
Qu 10509  94( (4) 
(2.9) Dk | a) — 985A 2162 4(n+L)a' 
n.n O n.n®) n?.n®@ 
Considerăm statisticile test 
(2.10) Z, BL. a A j= 2, 3, 4 
y. (4,2) 


care pentru valori mari ale lui 2. și n sînt repartizate N(0,1). 

Testele bazate pe k, si k, dau rezultate bune pentru volume de 
selecție mai mari decît 15 şi respectiv 16. 

Exemplul 2.1. Presupunem că într-o selecţie de volum 29, 2 = 
= 1,5172 si k, = 1,3300. Valoarea lui (2.10) cu D*(k,| 2) dată de 
(2.6) şi à înlocuit prin z este 0,462. Nu putem respinge ipoteza conform 
căreia, selecţia provine dintr-o populaţie Poisson. 


3. Teste de ajustare în cazul repartitiilor trunchiate 


Presupunem că selecţia 2,, Za. و‎ 2, provine dintr-o repartiție 
Poisson trunchiată la stînga, adică x2,>c pentru i = 1,2,..., m. 

Propoziția 3.1. X. este o statistică suficientă. 

Testul optim de omogenitate pentru repartiţia Poisson trunchiată 
este bazat pe repartiţia lui k,. Pentru æ. fixat, testul bazat pe kz 
este echivalent cu testul bazat pe E = Y, XP. 

Funcţia, de verosimilitate a selecţiei este 


js ER C qi T gu qu 
í 11 a OT 
$=1 
94 


unde 
(3.2) fa) = eè — y 2 ! 
j=0 


۳ ㆍ .q. . v ^ . 
Estimatorul de verosimilitate maximă Ayy pentru A se obţine 
prin metode iterative. 


Propoziția 3.2. Repartiția marginală a statisticii X. este 
nm! 2۰ 


0۱/2. A e) = S(X.;n,c) X.=n(e+1),n(e+1) 41 
x W X. AONT ( و10 و‎ €) le) (e + )+ 
8: 


gee 


unde S(X.5 n, c), numerele Stirling generalizate de al doilea tip, sânt 
definite de 

oo 2x. 
(3.4) ACS = di WESCA A o) Yr 


X.=n(e+1) X. 1 


Propozitia 3.3. Estimatorul nedeplasat gi de dispersie minimă 
pentru A este 


(3.5) Ad = X. R(X.; n; 0, 
unde 


S(X.—i,n;c) 
S(X., n; 0) 
R(X.,n;c)<1 pentru i21 

.1-= )0 0-3 .تاو 


(3.6) R(X.;n,c)= y A. >Afc - T, 4—1,2,; 


Propozitia 3.4. Repartiția vectorului variabilelor de selecție X — 
(Xis Az, ..., Xn) conditionate de X. = a. este 
ei * , 20. ! t 
(3.7) h(X | a) = مات‎ AU PRE = ~ 
(Ios !) S(x., n, e) 
și nu este functie de ۰ 
Un test de semnificatie exact este bazat pe statistica 


(3.8) y E 2 h(X| 2.), 


unde Q este mulţimea vectorilor X = (X,, X,,..., X,) astfel încât 
Y, X, = v. şi Eze, valoarea observată a sumei Y ae. 

Deoarece pentru valori mari ale lui x. calculele sînt greoaie 
considerăm teste aproximative bazate pe momentele condiţionate 
ale lui E — Y x), 
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Fie 3(X) orice funcţie de X cu media necon finită. 
Avem 
oo 
(3.9) M(5) = Y. M(S|zx.)Jg(x., ^; c) 


x.=8n(c+1) 


sau tinind seama de expresia lui y 


i REY qan e 
(3.10) Mes M(-— y MI 
n! x=a(c+1) 
Urmează că 
TE E {> n 
Kx NS = piei a a ۹ ES m A) MAIS 
(3.11) M(8| 2.) = - _ fovet. lui 3* din JO M(8) 
S(2.;N. 6) n! 


n 
şi deci, dacă 8(X) = Y XP 


JO) 


unde fm(A) = e^ pentru m < 0. 
( 


Din (3.11) avem 
m 1 
MY, XP 2.) = ———— x 
S(2.5905.€) 
i LEA) 
(3.12) x {coe lui A* din Mf,.,(2) ۷ Eh 
n! 


Dezvoltind f,(A) in serie, găsim 


(1) m) G) / 0 ji e" 
MS | 2.) = a2 LE و2۷‎ 0 T à 124 $ pa 
(3.13) 
X (By-p-1[2., n5 0) — nE, (m.m; 2] 
Pentru j = 2, E = رو‎ XP si 
(3.144) M(B| 2.) = at? LL 0) A er {1 —nR,/(2., n; 0) | 


Această relaţie ne permite să construim un test bazat pe ka’ 
Definim statistica 


1 aie k 
(3.15) dati HM, 
M(k,| x.) 
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care este exactă in sensul că M(y?| 2.) = n —1 (Repartizata 


vn — 1) 
Cum i 
(n= DE = Y 2*9 +2 0" 
obtinem 
is (n— 1) Y (EY 
na(1 + Àpy — T) Apa + no(t — om) 
Pentru 0 = 0, (3.16) devine 


— 1) X. (a — 5)? 
(3.17) „a _ An E a 


nall + Apu — 2) — Anu 


to 


3.16) 


Aa 


În acest caz se mai poate folosi statistica, 


. (2, — c) 
(9.18) tio = 2 


AW ANA = 
g(1-- 704) 
unde Aya este estimatorul de verosimilitate maximă pentru A. 


. = 5 ^ PA A ی‎ Lr. A 
Pentru valori mari ale lui n, Apy este apropiat de Amy $idacán> Au 


atunci y? este apropiat de xke- 1 
Este adevărată următoarea relaţie de recurenţă 


(~.—c)R,(x.— و6‎ n—1; c) 


R,(v.+1, n ;¢)= سل‎ ds 
AO no. — e) R(x. —c,n —1;0) — no.R,(z.,n; c) 
(3.19) 

cu 


Hæ. 
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CAPITOLUL 5 


TESTE DE TIP KOLMOGOROV-SMIRNOV 


Introducere. Funcţia de repartiție empirică 


In testul X? de ajustare (concordanţă) se face comparatia 
dintre frecvențele observate si cele teoretice pentru o mulțime de 
k grupe. Se fae numai k « compar: atii chiar dacă sint n observaţii, 
unde k < n. Dacă avem o selecţie de volum n si nu variabile împărţite pe 
grupe, se pot face comparații între frecvențele (observate) relative cumu- 
late si funcţia de repartiție teoretică pentru fiecare dintre diferitele va- 
lori observate. Funcţia de repartiție à selecţiei sau funcția de repartiție 
empirică poate fi considerată ca un estimator pentru funcţia de re- 
partiție teoretică asupra căreia s-a considerat selecţia. Multe dintre 
testele de ajustare (concordanţă) se bazează pe funcții de abateri 
ale funcțiilor de repartiție empirică de la cele teoretice (în ipoteza 

ji 


nulă). Funcția de aceste abateri poate fi suma patratelor, sau va- 


loarea absolută, sau maxim ul abaterii ete. Cea mai cunoscută functie 
de acest fel este statistica Kolmogoroy nirnov. 


E 


nainte de a prezenta testul bazat pe această statistică, vom 
discuta unele proprietăţi ale funcţiei de repatitie empirică, care este 
un instrument puternic în inferenta neparametrica. 
Definiția 1 
volum n, notată prin S,(z) si definită pentru toate numerele reale a 
este proporţia valorilor de selecţie care nu depásese numărul a. 
Astfel, S,(x) este o funcție în trepte ce creşte cu cantitatea 1/n 
în puncte Je sale de salt, care sînt 


j atistic ile de ordine ale selecţiei. 
Dacă X, X, ..., Am sint stati: ۳ de ordine ale selecţiei, funcţia 


.7. Funcția de repartiție empirică a unei selecţii de 


de repartiție este definită, 08‏ ما تسم 


«ay € X Rua. Pentru Ks 1, 2, ود ره‎ 9354 
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Adeseori S,(z). este numită imaginea statistică a populaţiei. 
Pentru un x fixat, însă arbitrar, $„(2) este o rariabilá aleatoare. 
Prin purus ea are o repartiție, repartiție care este datá in 
Teorema 1.1. Pentru variabila ۵ one) care este functia 


de repartitie empirică a selecției X44 Xapi ++) 4 X, din populația avind 


funciia de repartitie Fy, avem 
P | S,(a). = zl = CLF) FA — Po) Pi, j = 0, ۰۰ ۰و‎ 
L n 
Demonstraţie. Detinim rariabilele indicator 
1 (1, dacă > 1 
m in rest. 


Atunci و(‎ Sa(t), ..., Sp(t) const tituie o mulţime de » variabile 
aleatoare independente repartizate Bernoulli de parametru 0, unde 


ve = PL ۵:)1( = 1] = P(X; > t) ias Fx(t). 


X(t) = 


~ 


Deoarece putem serie 


ud io 
Sala) = Y, وا ی‎ 
i=l n 


variabila aleatoare nS, (x) este suma a n variabile aleatoare indepen- 
dente repartizate Bernoulli, sumă ce urmează o repartiție binomială 
de parametru 0. 

Corolarul 1.1. Media și dispersia statisticii S,(0) sînt 
Pelo [1 — Px(2)] 


n ۰ 


M[S,(2)] LS F; x(a 2), D? Sate )] 1 


Demonstraţie. Deoarece nS,(x) ~ Bi (n, Py(2)), 
MinS,(x)] = nFy(x) şi D'[nS,(z)] = nFx(x)[1— Fy(2)], 


ceea ce demonstreazá corolarul. 

Corolarul. 1.2. (S,(2)] este wn sir consistent de estimatori pentru 
Fy(%) sau, cu alte cuvinte, / S„(2) converge in probabilitate către P(x). 

Demonstrația rezultă din legea numerelor mari. 

Observaţie. Convergenta din corolarul 1.2 este pentru fiecare 
valoare individuală 2, in timp ce sintem interesaţi în toate. valorile 
lui 7, colectiv. 

Următoarea teoremă dă o comportare probabilista pentru toti 
æ simultan. 
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Teorema 1.2. (Glivenko-Cantelli). Kale). converge uniform către 


Py(2), adică pentru fiecare e > 0 
lim PL sup |S,(z) — Fx(#)| >£] = 0. ۰ 


00 > > ۵0 
O altă proprietate folosită a funcţiei de repartiție empirică este 
normalitatea sa asimptotică. 
Teorema 1.3, Avem 


tin Potente) Fatal < i = 
VPz(z)[l— Fx(2)] 


.. Demonstraţie. Din teorema limită centrală, din teorema 1.1 si 
din corolarul 1.1, funcția lui Laplace este funcţia de repartiție (asimp- 
totica) a statisticii 


P(t). 


noo 


nFy(a)‏ — )1( م10۵8 
|n) — Fx(®)]‏ 


Vn[S,(a) — Fx(z)] 
1 ل](2)‎ — Px(2)] 


2. Statistici de tip Kolmogorov-Smirnov 


Fie Xy Xos ..., X, o selecţie asupra unei variabile aleatoare 
cu funcţia de repartiție F(x). Pentru orice valoare a lui z, functia 
de repartiție empirică $,(z) constituie o estimatie consistentă pentru 
Fy(a) (corolarul 1.2). Teorema Glivenko-Cantelli (teorema 1.2) sta- 
bileste că funcţia in scară S,(«), eu salturile realizindu-se în valorile 
statisticilor de ordine ور‎ Xe, ..., X » se apropie de funcția de repar- 
titie adevărată pentru toti r. Prin urmare, pentru valori mari ale 
lui n, abaterile dintre funcţia adevărată şi imaginea sa statistică, 
|S, (2) — F(a) |, vor fi mici pentru toate valorile lui 2. Acest rezultat 
sugerează că statistica 
(2.1) D, = sup | S,(x) — (| 

x 


înv pentru orice n, o măsură rezonabilă a acuratetii estimatiei 
ăcute. 세 


„Definiția 2.1. Statistica D, se numeşte statistica Kolmogoroy- 
Smirnov pentru o selectie. 
Definitia 2.2. Abaterile directionale 


(2.2) Di = sup[S,(z) — F,y(a)], Dz = sup[Fg(x) — S,(a)] 


se numesc statisticile unilaterale Kolmogorov-Smirnov. 
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1 1 1 1 Ed PA A ap Hu ELE = 
Teorema 2.1. Statisticile D,, Di si Dz au, pentru orice Fy con 


nim statisticile de ordine 
Ap = — © ŞI Xing) = 00 
și putem serie 
4 * A. 
S,(r) = — pentru Xg SZ > Xar 
n 


4 = 0, 5 و‎ e 


Prin urmare avem 


D; = sup[S,(z) — Fx(z)] ^ max SUp 
x O«i«n Xqy«xXq 11) 


[Sy (2) TE Pre) bs 


— max sup Po i F(2 | = 
oH) 


O<ign × کر‎ > n 


i T i ab. 
(2.3) — max | — — inf | = 
O<icr | N رب > کر‎ 
i ۳ d 
D ; ۱ 1 ۲ 
— max . - ㅡ Py(X,,) | = max {max |: از‎ ZI of 
O«i«n| M 1«i«n| "t 
Similar, 
i RO 
D, = max J max | Fx(Xw) ——- [| 
1<i<n n 
(2.4) 
i ^X i—1 
D, = max 10, max | — — Fy4(.X,)) |; max Fy(Xw) — rum 1 
l«i«n N 1<i<n , 


Prin urmare, funcţiile de repartiție ale statisticilor D,, D; si 
D, depind numai de variabilele aleatoare Fy(Xi), i = 1, ..., ۰ 
Însă acestea sînt statisticile de ordine ale unei selecţii asupra unei 
variabile repartizate uniform pe (0,1) indiferent de forma funcţiei 
Fy atâta timp cit este continuă. 

Astfel, D,, D; si D; au repartitii libere (repartitii care sint inde- 
pendente de funcţia de repartiție Fx particulară). 

Pentru a folosi statisticile Kolmogorov-Smirnov pentru infe- 
rente, trebuie sá le cunoaştem repartitiile. Deoarece repartitiile sint 
independente de Fy, putem presupune că Fy corespunde unei repar- 
titii uniforme pe (0, 1). 
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Teorema 2.2. 


X 


Pentru D, = sup | $,(») — Fa) unde F(a) este 


orice functie de repartiție continuă, avem : 


| ۱ | 
P(D, ete d = 0, pentru. c. x Q, 


2n ) 
Dan 
è : 2n — 1 
= 1, pentru v > ^ 
i 2n 
81 
1/2n--v 3/2n+v (2n —1)/2n t v 
pă 
= | JUL, Ug, ۰۰ Un) du, ۰۰۰ du, 
1/2n—v 3/2n—v (255 —1)/2n—v 
9 
2n — | 
Ups Ve pentru 0.<.0.< EM 
y 2m 
unde 
PEO Qu A 4e wl. A C 
f; Mo, <<, Un) ~ ۱ “A h a RUP Un 4 


0 in rest. 


( 


Demonstraţie. Py(x) poate fi luată ca; fiind funcția de repartiție 
a unei variabile repartizate uniform pe (0,1). Mai întîi vom deter- 
mina domeniul lui v. Deoarece atît S,(z), cit si F(x) au valori între 
0 şi 1,0 > D,,< 1. Prin urmare, trebuie să determinăm P(D, < c) 
numai ۱ pentru 0 > c < 1, care în cazul de faţă cere 


y + 
< {804 a ea e E 


2n 2n 2n, 


1 ; (n. «33 de gif 
i ; V < — > unde ۸ (0) == 0 ŞI Ă n ولاحت روپ‎ 


7 


2n on 


Bh ii 1 \ 1 
: Pl D, ۷ "M m v ㅣ ej 42 sup | Sale) a ponte de = ا‎ vi = 
an / x 2n 


i 179 S M ml A 1 ۱ ^ 
= IS) | < —— +0, pentru toţi. 2 | = 


2n 


2n 


|^ | 1 

y ㅣ ^ 

Di! 3 > ot LS = S , 3 یی‎ et d 

] ۳ F pentru Xy << وب‎ 
Li 


pentru toti i = 0,1, ۷ d ss 


7 P 8 1 à = y t 1 
: . if pi وی‎ E aa o, 
Ln 2n n 2n f 
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pentru X, > ۸ > 


pentru POEL Bee 0,1) os d ES. 


; pentru ¡Xi < Y 
i ۱ pentru toti 4 = 0,1, ..., d 


Considerăm oricare două. valori consecutive ale lui i. Pentru orice 


0 < 7 < % — 1 trebuie să avem 
i 1 
1 205 | 21+ 1 i : d 
سس 2 > 0 — :را‎ v pentru X < £ > Xur 
| 2n 2n 
| | 
( 2i د‎ 1 21+ 3 
e, $71 y A ۱ 
-— t 1 > — + v pentru X445 SI > روبص‎ ۰ 
2n 2n 1 
Deoarece Xup este o variabilă aleatoare comună celor două eveni- 
mente si mulțimea comună a a-lor este 
(2i + 1)2n —v « « < (2 + 1)/2n + v pentru 9 > 0, 
evenimentul 4,n.4,,, pentru orice 0 < 1 < n 1 este 
2,41 (4 . 92i --1 & He 
مس‎ — 4 X (i+) ec ————— 0 jen tru LOL f > 0 
2n 2n 
Cu alte cuvinte, 
1 97 +1 
) - 1 a? J x7 
لے‎ — 9 g < ——— +0 pentru Ay S X S A qa 
2n 2n 


pentru toţi i = 0,1, ...,% 


: 0< Xer > + v: pentru toţi 1=0,:1,...,n—1, 
2n 2n 
v > 0. 
ensitatea de repartitie comună corespunzătoare statisticilor de 
rdir e este 
Ox : 4 (x qp BIR, PE Sel 
XX مر‎ XD 72: n) 
pentru 0 pig. v. d, nl 
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Urmează cá 


1 : 2n — 1 
리쓰 <—— + 0] pentru toti — — > > 
2n 2n 9m. 
2i 4- 1 2i +1 
> 해, y i 
E z NEA a fe 
20 2n 
pentru toţi ? = 0,1, ...,»—1) 
: 2n — 1 
pentru toţi 0 < ۰ > — 
2n 
p 1 - Y 5 j 3 
=p ja ti vilei a ay oos dl impe = 0 A Ay eo 00000 
2n an 2n 2n 


pentru toţi 0 < v< 


ceea ce demonstrează teorema. 
Tustrăm cazul n = 2. Pentru toţi 0 > v < 3/4 


1/4+v 3/440 


P(D, < 1/4 + v) = 2! dus ۰ 


1/4—v 3/4—v 


Cind 0 < v < 1/4, avem u, < ug. Prin urmare, pentru 0 < » <1/4, 
| 
1[4+v 3/440 


P(D, > 1/4 + v) = 2 du, du, = 2(2v)*. 


1/4—v 3/4—v 


Pentru 1/4 < » < 3/4 regiunea de integrare este ilustrată in 
fig. 5.1. Pentru 1/4 < v < 3/4 avem 


1/4 -v 1 3/4 —v 1 
P(D, < 1/4 + 0) = 2| | | du, du, + | | dus au | ES 
3/4—v ty 0 3/4-v 


= — 207 + 3v — 1/8. 
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Adunind aceste rezultate pentru toti v, 


0 ee 0 | 


2(20)? , 0 > > 4 
P(D, « 1/4 + v) = j 


U? 


| 
| 
(03/4- Viper! | 
( E 
E (114+ v,o) ed 


Fig. 5.1 


Pentru orice v si n dati, putem evalua P(D, < 1/2 m + v) 
sau folosi tabelul 1 a lui Birnbaum (1952). Procedeul invers: constă 
in a găsi numărul D, astfel încît 


PUD, > D, sya. 


In exemplul de fata cu n = 2, a = 0,05, găsim v astfel încît 


gi atunci luăm .D2;0,05 = 1/4 +-v. Avem 


2(2v)? = 0,95 si0< v < 1/4 


20? + 30 — 0,125 = 0,95 si 1/4< v < 3/4. 


Primul rezultat nu are soluţie, al doilea însă da 
v= 0,5919. Prin urmare D2;0,05 = 0,8419. 
Birnbaum (1952), Owen (1962) tabeleazá Dna pentru e == 0,01 
= 0,05 pentru diferiţi n. 
Pentru selecţii de volum mare, Smirnov (1939) obţine pentru 
repartiția statisticii D, următoarea teoremă. 


soluţia 


Si a 
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Teorema 2.3. Dacă Fy este orice functie de repartiție continuă, 
atunci pentru fiecare 2 > 0, 


Funcţia L(2) a fost tabelată de Smirnov (1948). 


Densitatea, de repartiție corespunzătoare este 


2,91 


)-1( 7? exp ( —2j?2?). 


Propoziția 2.1. Momentul de ordinul r față de zero este 


T 
co " 
MR RUNS 
y )-1( ود‎ 
j=l 
În particular, 
rip vss | M 
(0,8687) 81 dispersia, este — x°— 
Teorema 2.4. Pentru D} = sup [S,(«) — Fy(x)], unde Fy(x) este 


Y 
orice functie de repartitie continuă, avem 


P(DÍ< 0) = 0, pentru c >, ۰ 


—1 pentru cz 1. 


1 un Us Us 


C í 
i ۱ ey \ F (yy Wyss وه‎ My) 1, Atty... du, 


~ 
1—c (n—1)|n—c 2/n—c 1/n=c 


pentru 0 > e <1, 


10,13: pentru. اک‎ < Us, 0 A 
0 , in rest. 
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Demonstraţie. Fără a pierde din generalitate presupunem 08 
P este functia de repartiție a unei variabile uniforme pe (0, 1). Atunci 


putem serie 
y 1 y 
Di- max | max | —— Xi], ۰ 
à l«i«nY N ۲ 


Pentru toti 0 < c < 1, avem 


: [ : 
PUDE TO) e dip S ia e [E 
1<i<n Y Y 


Xu, > e pentru toti t = 1, 2, ..., n) =‏ مد 


n 
P| X - € pentru toti i = 1, 2, ..., n) Ps 

| ^ j 

00 co "co 
x P a j 
\ \ «i \ Flay, Lo, 5:24) dar, das... de; 
0 ) 
-c (n—1)/n—c 2/70 - 1/n=c 


ceea ce demonstre: 


Teorema 2.5. (Birnbaum, Tingey (1951)). 4vem 


yn =j + yy-i-! 


2n si trecem la limită pentru n — co, obţinem 


J 
Teorema 2.6. Dacă Fy este orice fumetie de repartiție continuă, 


02000) pentru fiecare 2 > 0, 


lim P|Di< ti A MUTE 어트 o2 


Corolarul 2.1. Daca Fy este orice funcţie de repartitie continud, 


1 entru fiecare 2 > 0, repartiția limită a siatistieii 
V = AnD}? cmd n > co 
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mii i دد غد‎ A 


Demonstrație. Avem 
Di > ارو‎ dacă şi numai dacă 4nDF2< 42% sau V > 42%. Prin 
urmare 
lim P(V< 42?) = 1 — e-?", 


"- CO 


lim P(V > c) = 1 — e“? pentru toti c > 0, 


"n-oo 
care reprezintă funcția de repartiție a unei variabile y?(2). 
Teorema 2.7. (Lauwerier (1963)). Avem 


VRB < 2)= 


n! 


jd : تن‎ 도 E 35, 
j=0 


| 


1 
8 + e 
n e-"/2% ^ 


ande polinoamele f,(-) sînt definite de identitatea 


poets det qam dp) X 


1 
(2.8) x exp Des + > p* — petgh p — log [p^ pi} = 


si H" (îm expresiile f,(H)) este interpretat ca polinomul Hermit de 
ordin r cu argumentul 22. 
Din aceastá teoremá obtinem 
P(/nD? > 2) = 1 — ex 
A f 교 .(02) , 3 — H,(22)  15H,(23) — 12H4(23) — 5H,(21) 4 


3 ni? 36 n 540 n3/2 
+ 45 — 60H4,(22) + 382H,(2A) + 5H,(2A) 
12960 n? 


-2 Jy 20 421 — 622 A ap oii), 
3/n 9n 


( — F(a))/F(x) sau 
Repartitiile acestor 


| + 00m = 


Adeseori, este mai natural sá folosim (S,(x 
(Sal) — #(x)) (1 — F(w)) în loc de S,(z) — F(a). 
statistici sint date in 
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Teorema 2.8. (Rényi (1953)) Avem 


im PV sup Sula) = Eta) x y) = 


1-00 asF(x) F(x) 


sV. 2 
1-4 


9 m A 
= 2 | e ۶ dt, y >0 
T 


0 


0 y > 0 


Teorema 2.9. (Rényi (1953)) Avem 


lim ۳ sup SE Ea 210) << y) = 
"co a<F(x) F(x) 
(2.10) 
| (2k +1)? 1—a 
iz exp| — ————— :——— 
Ap 8 a J}, و‎ < ۵ 
a Rud me 2k + 1 
0 ,y > ۰ 
Sale) — F(a) 


Rényi consideră repartiţia limită a supremului lui şi 


F(a) 
a valorii sale absolute în intervalul 2, < 4 > a, unde a, $i وه‎ sint 
definite de relatiile 


F(a) = a >0 şi F(x) =b<1 (0 > a «b <1). 


Teorema 2.10. (Rényi (1953)) Avem 


= ( — Fl: " 
lim P[Vn sup Sala e Fw) <) = 
n-»co a &F(x) <b F(x) 
(2.11) 
9B a  4(By-9) a 
| oF at) du, — o0 > y < ce 
¡TU 


eu B —Ybi(1 — 5); A = Ya(3—b)/(b — a). 
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Teorema 2.11. (Rényi (1953) ۰ , 1 
سسا‎ |; 4 1 
lim (7 sup | Sala EUR. Hs. Y xy = 
ج و‎ 00 a<F(x)<b | F(x) | 


0 لا و‎ <0 
cu 
o E u? 
E, = 1, — اور‎ e 2 du + px 
YB 
si 
by? py E 
9e 20-0) HO SA. 
Pr = - e ?» sin udu. 
PR 0 
l—a* ð 
Teorema 2.12. (Birnbaum, Lientz (1969)) 1 
ir Sal) — F(a) ) 
P| sup ie را‎ <o| = ba + iy ai S 
F(x) >b Pia) a 
(2.13) 
| 11 T Yi fs T E Sas ET ANN á 
+ $ (—1/01.,(b — 0,,) (1—0), —1«& 0.<b*-—1, 
j«K 
unde 
O, = (n(1 + e) M3 +k) şi K=b(140)n-— k. 


nlocuind b prin (1 — a) eu a >0, membrul sting al relaţiei 


(2.13) devine 


사기 열개. ln 
P| sup Ple) — S). 1 


1 Fíxj<a 1 — F(x) 


i domeniul de variație poate îi definit 
iad Acesta este un domeniu aleatoz i e 

o seleet ta. Deoarece S (œ) poate fi egal cu 0 sau cu 1, vom 

exclude el RY hui بر‎ (a ) care fac numitorul zero, adică sup (LS, (1) — 


; 
— F(x)]/[1 — S,(2)]] va avea œ restrins la S,(z) « 0 < 1. 


Va 


110 


Motivul introducerii acestor statistici este folosirea lor in con- 
struirea intervalelor de incredere. Acesta este bazat pe faptul ca 
inegalitatea 


19.(2) — F(a) 
(2.14) sup sede A ls A Enc LIED lv 


este echivalentă cu 


(2.14) (1 + 2)-18,(@) > F(x) > (1 — 215 (2) 
pentru toti z în domeniul lui x pe care este luat ,sup" 
înlocuind F(x) de la numitor prin S,(«) repartiţia limită nu se 


schimbă. 


Teorema 2.13. (Birnbaum, Lientz (1969), Csórgó (1965)) 


3. Aplicaţii ale statisticii Kolmogorov-Smirnov pentru o selecţie 


st Kolmogorov-Smirnov se foloseşte in mod ol is 
în testele de ajustare (concordant eit P resupunem că avem O s eloch 
Xy, Xs, و...‎ X, pe baza ci areia dorim sá v erifici im ipoteza 


H,:Fg(r)- F(x) pentru toti x 
cînd P(x) este o funcţie de repartiție complet specificată. 
Deoarece S,(x) este imaginea statistică a funcției Fy(a), dacă 
a nulă este adevărată diferenţele dintre S,(w) şi Fo(w) vor, fi 
pentru toţi z exceptind variaţia de selecţie. Pentru testul Kol- 


DC 


mio, 
MICI T 


mogorov-Smirnov bilateral cu alternativa 
H,:F x(x) 4 F(x) pentru unii x 


valorile absolute mari ale acestor abateri tind să discrediteze ipoteza. 
Prin urmare, testul Kolmogorov-Smirnov, respinge ipoteza H, la 
pragul de semnificaţie a cînd 


(3.1) DEA Di 


Din teorema Glivenko-Cantelli, S,(z) converge către Fy(w) cu pro- 
babilitatea 1, fapt care implică consistenţa. 
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ftia ces qoe و‎ 저어 aoe lb 


MM een E مم اھ مج مل‎ ode n e 


Cu statisticile D si D; se pot construi teste unilaterale care să 
detecteze diferenţele directionale dintre S,(a) si F(a). 

Pentru alternativa 

H+ : Fx(2) > Fo() pentru toti x 
regiunea de respingere este 
(3.2) Der Pa 
şi pentru alternativa 
H,.: Fy(x) > Fils) pentru toti x 
(3.3) 
Dic D 

Aceste ultime două teste sint consistente faţă de alternativele 
respective. 

Alte două aplicaţii ale statisticilor Kolmogorov-Smirnov se 
referă la estimatia punctuală şi prin interval a functiei de repartitie 
Fy necunoscută. 

In cazul estimatiei punctuale, dorim să găsim cel mai mic n 
astfel încât; 

PESA AA 
Deoarece e = D,a este dat, valoarea lui n poate fi găsită din tabele. 
Poate fi folosită si teorema 2.3 rezolvind z, = e/n in raport; cu n. 
O altă aplicaţie constă în folosirea statisticii D, pentru găsirea, 


unei benzi de încredere pentru F';(«) pentru toti x. Folosind o tabelă 
găsim numărul D,, astfel încât 
AD 5- Ds 시 
Aceasta este echivalentă cu presupunerea 
Plsup | S„(2) — Fx(z)| > D,,] = 1 — a 
sau f 
ES) — Dog < File) > S,(2) + D,, pentru toti 2] = 1 — a. 
Știm cá 0 > Fy(x) > 1 pentru toti 2, în timp ce în inegalităţi 


în această presupunere probabilistică se admit numere în afara, acestui 
domeniu. 


Astfel definim : 
(3.4) L,(%) TT max [S,(a) Kur D, 0] 
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(3.5) 0, (2) = min[S,(z) + Dasa 1] 


gi numim regiunea dintre L,(z) si U,(x) bandă de încredere pentru 
Fy(w), cu coeficientul de încredere 1— «. 

În aplicaţii, cel mai simplu procedeu este de a reprezenta S,(a) 
observată ca o funcţie în trepte și de a trasa linii paralele la distanţa 
Dn de o parte $i alta a sa, însă întotdeauna in patratul unitate. 
Cind n > 35, valoarea lui D, poate fi determinată din repartiţia 
asimptotică. Desigur, această bandă de încredere poate fi folosită 
pentru un test pentru verificarea ipotezei Ho : Fy(2) = F,(x), deoarece 
F, (x) variază în întregime între limitele L,(x) si U,(z) dacă si numai 
dacă ipoteza, nu poate îi respinsă la pragul de semnificaţie a. 

Observaţie. Toate proprietăţile teoretice ale statisticilor Kol- 
mogorov-Smirnov cer ca Fy să fie continuă. Proprietăţile funcţiei de 
repartiție empirică dată in $1, incluzind teorema Glivenko-Cantelli 
nu cer această proprietate de continuitate. Prin urmare, prezintă 
interes existența unui test de concordanţă care poate fi folosit cînd 
repartiţia specificată în ipoteză nulă este discretă. Noether (1967) 
arată că dacă sint folosite valorile D, , bazate pe Fy continuă într-o. 
aplicaţie discretă, pragul de semnificaţie adevărat este cel mult 
x. Prin urmare, putem folosi acelaşi procedeu pentru F (x) discretă 
ca pentru cea continuă, testul fiind conservativ. 

Wood, Altavela (1978) consideră problema verificării ipotezei 


Hy: F(z) = H(z), —oo < v > co, 
unde H este discretă, fata de alternativele de forma 


Hu: F(z) > H(x) cu F(z) > H(x) pentru unii a 
sau 
Hı: F(x) > H(z») cu F(z) < H (2) pentru unii « 
sau 
Has: F(x) 4 H(z) pentru unii a. 


Corespunzător la fiecare din alternativele anterioare, o măsură 
a diserepantei- dintre funcția de repartiție empirică și funcţia de 
repartiție ipotetică si deci între F si H, este 
Di = sup Vn{F,(2) — H(2)}, 
x 
(3.6) D; = sup /n(H(w) — F,(a)), 
a 
Dj == sup Vni F(a) — H(a)|, 
x 


8 = e. 271 118 


statisticile Kolmogorov-Smirnov pentru -verificarea ipotezelor Hy, 


H> 8i respectiv 77,4. Deoarece F, si H sint amindoua funcţii în trepte, 


Di = max /n(F, (1) — H(z)), 
xeJ 


max 2 
xEJ 


) — P, (2) 


D, = max y ^| (a) 
xej 


F(z) |, 


inde J este mulţimea punctelor de discontinuitate ale funcției H. 
Am văzut că statisticile Kolmogorov-Smirnov, pentru funcţii 
de repartiție absolut ی رو‎ au repartitii libere (teorems 2.1). 


Totuşi, relaţiile dintre (3.6) şi (3.7) indică faptul că aceasta nu este 
adevărat pentru repat rtitii discrete. In particular, dacă W° reprezintă 


ŞI 0 Sit) Mees 


mitidimensionala 


cu fiecare k 
normală n 


un proces Wiener pe [0,1] adică 1 
(Wh) و...‎ Wo(t,))” are o repartiti 
cu vectorul v aloare medie 0 si 


MEWO(t,)Wo(t,)) 


în ipoteza nulă avem urmáto 
Teorema 3.1. (W ood, Altavela ( Repartitiile statisticilor 
( i l 
13. D; $i respecti Ln sint date de 


max[W?!H(x))] si respectiv max LH (a 
*EJ xEJ 
De exemplu, presupunem că H are r discontinult Atunci, 
pentru orice A> 0 
lim P(D A) x P[m x] Y 9f H( Me Tr s 
مج زو‎ xeJ 
= 1 — P[max| WH (æ) <A] = 
&J 
LENS A 2 IZ A 
| 4411 ۸ و‎ | 2-1 = ) 
de (Z,,...,Z,-,)' este un vector normal cu J = 123,..., Lr} 4; « Ly, 


M(Z,) = 0, M(Z,Z,) = min{H(a,), H(zj))) = Hle) H(z): 


normală multidimensionalá, aceasta pro- 
ea poate fi obtinuta 


Cu toate că în forma 
babilitate nu este cunoscută, pentru un A dat, 
prin simulare. 
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4. Puterea testului Kolmogorov-Smirnov 


Verificăm ipoteza 
| Hio Rigy = Baa) 


fată de ipoteza alternativă 


unde Fi şi G me functii date. 
! din (3.1) este ales astfel incit 


t a, 2 
Determinăm 


nimentul D,< D,a se realizează dacă şi numai dacă pentru 


L<Kia nm au loe 


Avem 


y 
۱ 
y 
a 
bu 
۱ 
IN 
Ma; 
er 
^ 
/ 
=~ 
「/ 
۸ 
R 
ae 
S 
= 
EE 
| 
| 


1 Y PE a الاک‎ k DRY | y] 
faxa) ce | re( + Daa) 
L 세 


ande F-1 este inversa funcției F. 


Kolmogorov-Smirnov 


Fie (t,) si {t7} două şiruri de teste, toate avînd acelaşi prag de 
semnificație pentru verificarea ipotezei 0 = = Oo fata de sirul de alter- 
native 0, ce converg către 0, si (mj, (m;) două şiruri astfel încît 


(5.1) fm 7¢,(0;)' ERO =P, 0 <p > 


1> 00 1— 00 


۱ unde z,(x*) este puterea testului {tn Mtn, y) în 0۰ 


115 


vitro 기어 TETPO 11 d 


Definiția 5.1. Cantitatea, 


$ . m; 
(5.2) e((,), (1%) = lim =- 
t-> 00 Ni 

se numeşte eficiența relativă (în sensul lui Pitman) a sirului {ta} 
în raport cu {tž}, dacă această limită există şi este aceeaşi pentru 
toţi m, n, satisfácind (5.1). 

Pe Ar ay 5 X, X3,...,Xm) o selecţie asupra unei 
variabile aleatoare X avînd funcţia de repartiție P, necunoscută. 
Ne propunem să verificăm ipoteza 


Hy: F(a) = (a) 
faţă de 


cu ajutorul testului Kolmogorov (t). 
Testul Kolmogorov unilateral respinge ipoteza Hy dacă 


(5.3) Vn sup[$(z) — 8,(2)] > Daya 


n—00 


1 1/2 
unde lim Da. = e log 0) 1 
Testul ¢ respinge ipoteza Hy dacă 
VmX 


(5.4) a pi Sm — 1) 


m 


unde sj = (1/(m — 1)) Y (7, — Ta) Si یا‎ — 1) este cuantila de 


1 
ordin 1— « a unei variabile t(1 — a). 
Teorema 5.1. (Ramachandramurty (1966)) Marginea ۵ 
a eficienţei lui (5.3) relativă la (5.4) este dată de 


(5.5) (2/7){(u,—. + Ug)/ [us + (2 log «7) J? 
Observaţie Pentru « — 0 
Urra (—2 log a) 


şi deci limita inferioară pentru eficiență este 2/z, independent 
de 8. 
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6. Teste de ajustare în cazul repartitiilor incomplet specificate 


6.1. Punerea problemei 


Fie X, X,,...,X, o selecţie asupra unei repartitii absolut 
continue. Ne propunem sá verificăm ipoteza compusă Hy conform 
căreia funcţia, de repartiție este de o formă funcţională cunoscută, 
Fo(2|0) unde parametrul 0, care poate fi şi un vector, nu este spe- 
cificat. În acest caz, tabelul 6 nu mai este valabil. 

David, Johnson (1948) arată că dacă PF, depinde numai de un 
parametru de poziţie 0, şi de un parametru de scară 0, şi dacă 
A A ㆍ ㆍ ㆍ ㆍ ㆍ ^ ㆍ 
0, si 0, sînt estimatori pentru 0, şi respectiv 0,, atunci în ipoteza 

2 A A 
Hg repartiţia variabilei aleatoare Fy(X, 0, 92) depinde numai de 
forma, funcţională a lui F, si nu de parametrii 0, şi 0,. De asemenea, 
dacă D, este definită de 


A 


(6.1) D, = sup | 8,(«) — Pole; 6,, 62)|, 


ㆍ LER ۰ A ㆍ v ㆍ ㆍ A 
atunci repartiţia lui D, este neparametricá şi prin urmare D, poate 
fi tolosită ca statistică test şi pot fi obţinute percentilele sale 
pentru orice F, dat. 


6.2. Testul lui Lilllefors 


6.2.1. Cazul normal 


Lilliefors (1967) dă un tabel (obţinut prin metoda Monte Carlo) 
care poate fi folosit cu statistica Kolmogorov-Smirnov pentru veri- 
ficarea ipotezei conform căreia selecţia a fost efectuată asupra unei 
variabile X ~ N(u, o?) cînd u şi o? sint necunoscuţi însă pot fi 
estimati. 

Testul Kolmogorov-Smirnov are două mari avantaje fata de 
testul X?, şi anume : 

i) poate fi folosit în cazul selectiilor de volum mic, unde in 
general X? nu se poate aplica ; 

ii) poate fi un test mai puternic decit X?, oricare ar fi n. 

Lilliefors (1967) consideră următorul procedeu : 

Dindu-se o selecţie de volum n, determinăm 


(6.2) D, = max | F*(x) — S,(a)], 
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unde P* este functia de: repartiție normală cu 


u = X, 8i c? = s? = dispersia de selecţie. 


그 ~ i . ۰ wv ㆍ 1 E] * 
Dacă valoarea statisticii D, depăşeşte valoarea critică din tabel 


respingem ipoteza conform căreia selecţia a fost efectuată asupra, 
unei variabile normale. 

Valorile din tabel s-au obţinut prin simulări. 

Comparind valorile obţinute prin simulare cu cele din tabelul 
standard pentru testul Kolmogorov-Smirnov observăm că raportul 
dintre valorile obţinute prin simulare şi cele standard rămîne relativ 
fix, in special pentru valori mari ale lui n; pentru valori mari ale lui 
n valorile descresc ca 1//n. Valorile obţinute prin simulare pentru o 
selecţie de volum n = 40 au fost multiplicate prin J 40 şi rezultatul a 
fost folosit drept numarátor al valorilor critice pentru selecţii de 
volum mai mare decît 30. 

Exemplul 6.1. (Tévissi, Vodă (1978)) O întreprindere se apro- 
vizionează cu reperul „cap pirghie de carburator” pentru care vrea 
să introducă procedeul de control statistic de recepţie descris în 
STAS 8820/72. 

Caracteristica de interes este alezajul O4. 9 os. 

Trebuie studiată mai intii normalitatea caracteristicii respective ; 
in acest scop, dintr-un lot experimental se extrag n = 30 p 
care se măsoară la caracteristica, respectivă. Datele primare, p 
şi frecvențele lor sint: 


31991 3,941" 3:90409.90 1997 3,98. 3:99 4/00 


1 2 6 10 4 2 1 
Găsim 
q = 3,9657 si 8 = 0,0151, 


A a Li 
D, = 0,1603 
si din tabelul 6.1. avem 


Dig; چورن‎ — 0,187 64 Danses = 0,161; 


ceea ce permite să acceptăm ipoteza de normalitate atit pentru 
a — 0,01, cit şi pentru « = 0,05. 

S-au făcut simulări asupra ] 
luat 500 de selecţii de volum 20 dir 
minatá probabilitatea de respingere f 
Smirnov. 

Acest test particular de tip Kolmogor 
malitate are acelaşi avantaj asupra testului 
gorov-Smirnov în cazul repartitiilor complet 


ost deter- 


Na îti a dM UI: 
1 0111۱00۳0۲۷۰ 


-Smirnov pentru nor- 
ea şi testul Kolmo- 
specificate. Testul 
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poate fi folosit pentru volume mici ale selecției, situații în care X? 
nu dă rezultate. 

Lilliefors (1967) face un studiu Monte Carlo privind puterea 
acestui test. Din fiecare repartiție au fost considerate cîte 500 de 
selecții de volum 20. Rezultatele sînt date în tabelul 6.2. 


Tabelul 6.1 


A 
Valorile critice ale statisticii D, pentru verificarea normalitátii 


A 
^re le semnificatie » a ) = axlE*(q)— S8 21 
Vrohimul Pragul de semnificaţie pentru Dy Max |F*(1)—Sn(x) 


selecţiei T ¡A AAA 
n D 5 | E | 01 
0,20 | 0,15 0,10 0,05 | 0,01 
| 
E - 
4 | | 
5 | 
6 
4 | 
4 | 
8 4 
9 3 
10 224 | 
11 217 
12 | „212 
i3 202 | 
14 194 
15 | 0,187 | 
16 | 0,182 
17 | ام‎ Og br 
18 | | 0,173 
19 | 0, 169 
20 | | 0,166 
25 | Q 53 | 
30 0,136 | 
| | 
Pes 0, 736 0, 768 0, 805 0,8 
1r p THEE 
30 Jn Jn | jn |n 


2 


Valorile statisticii X? au fost de asemenea determinate pentru 
fiecare selecţie (folosind 4 intervale). Intervalele au fost determinate 
asttel încît să aibă probabilitati egale sub curba normală ajustată. 

Din Observatia iii) de la teorema 1.4.1 urmează că repartiţia, 
asimptotică a lui X? se află între (2801) si x2(3). Cind punctul critic 
Yázoos (1) a fost comparat cu rezultatele obţinute prin simulare s-a 
găsit că probabilitatea erorii de ordinul I este 0,11. Deoarece această 
probabilitate este depărtată, de valoarea nominală, punctele critice 
au fost determinate pentru y? prin simulare. A fost găsit că valorile 
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5,2 si 4,0 dau ca probabilitáti ale erorilor 0,06 şi respectiv 0,12. 
Folosind aceste noi valori critice s-a tabelat probabilitatea de res- 
pingere. 


Tabelul 6.2 


A 
Probabilitatea respingerii ipotezei de normalitate folosind statisticile D, si X? cînd n=20 
(Numerele sînt rezultatul metodei Monte-Carlo eu 500 selecții pentru fiecare repartiție) 


| testul Kolmogorov—Smirnov testul X? 
AM Emativà |  folosind valorile critice din folosind valorile critice date 
a EETAS AN tabelul 6.1 | de metoda Monte Carlo 
| p = 0,05 p = 0,10 p=0,06 | p=0,12 
| 
| | 
Normală | 0,06 0,10 | 0,06 0,12 
x? (3) | 0,44 | 0,55 0,20 0,27 
(3) | 0,50. | و0‎ 88 0,40 0, 52 
exponentialá | 0, 61 | 0,72 0,29 0,41 
uniformă | 012 | 0,22 | 0,10 | 0,18 


Probabilitatea de respingere a ipotezei de normalitate a fost 
determinată (cu metoda Monte Carlo) pentru o selecţie de volum 
10 folosind statistica Kolmogorov-Smirnov şi punctele critice din 
tabelul 6.1. Aceste rezultate sînt date în tabelul 6.3. 


Tabelul 6.3 


Probabilitatea respingerii ipotezei de normalitate folo- 
^ 


sind statistica D}, n = 10 (s-au generat eite 500 de 
selecţii pentru fiecare repartiție). 


p = 0,05 p = 0,10 
Normală | 0,05 0,10 
x? (3) | 0,23 0,35 
t(3) | 0,28 0,36 
Exponentialá | 0,34 0,46 
Uniforma | 0,07 0,13 


6.2.2. Cazul exponential 


Lilliefors (1969) dă un tabel pentru statistica de tip Kolmogorov- 
Smirnov pentru verificarea ipotezei conform căreia o mulțime de 
observaţii constituie o selecţie asupra unei variabile X repartizate 
exponential cu media nespecificată. Procedeul este următorul : 
fiind dată o selecţie de volum n se determină 


(6.3) D, = max | F*(a) — 8,(4)), 


a 
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unde 

F*(w) este funcţia ‘de repartiție a variabilei exponentiale cu 
lf ند‎ 

Dacă valoarea lui D, depăşeşte valoarea critică din tabele se 
respinge ipoteza conform căreia selecţia provine dintr-o populație 
exponențială. 

Valorile critice pentru statistica, D, au fost obtinute prin simulare. 

Comparind valorile obţinute cu acelea din tabelul standard 
pentru. testul Kolmogorov-Smirnov, observăm că pentru un prag de 
semnificaţie fixat raportul lor crește uşor pentru valori mici ale 
lui n $i este aproape constant pentru n > 9. Cantităţile tabelate 
pentru n mai mare decit 30 au fost ebtinute aplicînd raportul -constant 
anterior la valorile critice standard pentru n = 50. 


Tabelul 6.4 


A 
Valorile critice ale lui D, pentru exponentialitate 


Volumul Pragul de semnificație pentru Da = Max |F*(x) — Sp(1)| 


selectiei 

n 630. P wis.] odo i005 [|0,0 
3 0,451 0, 479 0,511 0,55 | 0,600 
4 396 422 449 487 | 548 
5 359 382 406 442 504 
6 331 351 375 | 408 470 
7 309 327 350 382 442 
8 291 308 329 360 419 
9 271 291 | 311 341 | 399 
10 263 277 295 325 380 
11 251 264 283 311 365 
12 241 254 276] 8 | 351 
13 232 | 245 2811 101128741110 888 
14 224 237 259 (fei RAT (6 
15 217 229 244 | 269 | 315 
16 211 222 236. -| 261 306 
17 204 215 229 | 253 297 
18 199 210 223 246 289 
19 | 193 204 218 239 283 
360. 188 199 212 234 278 
25 177 I 380 0201 210 247 
30 | 155 | 164 | 174 | 192 | 226 
Peste | 0,86 | 0,91 | 1,96 1200 51728 
oy | Vn | Ya | n | yn | Yn 


Comparind tabelul 6.4 cu tabelul standard corespunzátor testului 
Kolmogorov-Smirnov, observăm cá valorile critice din tabelul 6.4 
pentru un prag de semnificaţie de 0,05 sint pentru fiecare valoare a 
lui » aproape aceleaşi cu valorile critice pentru pragul de semnificaţie 


121 


0,20 folosind tabelele standard. Astfel rezultatul folosirii tabelelor 
standard, cînd valorile mediei si abaterii medii patratice sint esti- 
mate, este obţinerea unui test extrem de conservativ în sensul că 
pragul de semnificaţie actual va fi mult mai mic decit cel dat de tabel. 
Tabelul 6.5 dă rezultatele unui studiu Monte Carlo privind 
puterea, testului Kolmogorov-Smirnov folosind valorile critice din 
tabelul 6.4 


Tabelul 6.5 


Probabilitatea de respingere a ipotezei de exponentialitate folosind statistica 
Kolmogorov — Smirnov eu tabelul 6.4. Numerele sint rezultatul unei simulări cu 1000 
de selecţii pentru fiecare caz 


———————— a e 


Volumul selecției 


MI TR 
Repartitia A | 


| semnificaţie 


10 20 | 50 
| { 3c TR INE O Yi pn 
Lognormalá | 0,01 | 0,023 | 0, 046 | 0,085 
| 0,05 | 0, 082 0,113 | 0,215 
| 0,10 0,153 | 0,204 | 0,431 
y iare | 0,01 | 0;105 | 0,265 | 0,623 
| 0,05 à 0,230 0,441 | 0,816 
| 0,10 | 0,383 | 0,569 | 0,929 


Acest test, Kolmogorov-Smirnov specializat pentru exponent ialitate 
are asupra testului X? acelaşi avantaj ea testul Kolmogorov-Smirnov 


2 


asupra testului X? în cazul repartitiilor complet specificate 


6.3. Testul lul Srinivasan 


Presupunem ci, Fola; Oi; ...,0,) este astfel! incit ty ...,¢ 
sint statistici suficiente pentru parametri Mio aah e eds 세 un 
ă ză : 


număr real fixat u definim variabila aleatoare Z după cum urme 


i d, XAU Y 
(6.4) Bi À 
0, în rest: 


Dacă ipoteza H, este adevărată atunci st; atistica Z este un estimator 
nedeplasat pentru Po(u; 0,:...,0,). 

Din teorema, Blackwell, Rao, (vezi Mihoc, Craiu (1976)) urmează 
că statistica 
(6.5) (하루미 O A E a Da E (că ese ud 
este un estimator nedeplasat pentru F,(w; 0, ...,0,) cu dis 
mai mică decit a lui 2), = (ti, ..., ¢,)). Dacă in “plus Ek i sint 
complete (ca în cazul familiei Koopman), atunci (6.5) este singurul 
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۰ 


estimator nedeplasat şi de dispersie minimă pentru Fy. Srinivasan 
defineste statistica Di după cum urmează 


(6.6) Da == sup y!| Slay -- F(a, 853.2, Og). 
—00< Xx <00 
Dacă repartiţia lui D, nu depinde de 6, ...,0,; D, va servi ca sta- 
tisticá test pentru verificarea, ipotezei. Ho. 
Srinivasan (1970) obţine estimatorul : Fy pentru cazul.normal cu 


media şi dispersia necunoscute precum si pentru cazul exponential 
cu media necunoscutá. 


6.3.1. Cazul exponential 


Verificám . ipoteza 
Pao GN ane Ms a > 


unde A(> 0) este necunoscut. Statistica 1 = x este suficientă si 
completă pentru A. Avem 


unde variabila Z este definiti de (6.4). (6.6) se poate serie 


(6.7) D, = max |S,(a) — Falai A). 
1<i<n 


Membrul drept al relaţiei (6.7) se mai poate serie 
max iS, (2) — FQ 
l<icn 

¿ Standar prin transformarea 


unde, pentru fiecare 1, e, este x 
Ci isi In consecinţă D, are. o repartiție independentă de 2A şi 


n 
ponin 1 a-i obține repartiția putem presupune că A = 1. 


Srinivasan (1970), pentru un volum al 
de aditu cai fie «, respinge ipoteza nulă dacă 


unde 


Punctele critice d, pentru diferite valori ale lui o (0,001; 0,01; 0,05; 
0,1; 0,15 ; si 0,2) si pentru n = 4(1) 10 (2) 30 sînt obținute prin simu- 


iare 81 sint date în tabelul 6.6. 
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IE Hapa eeyan 


Tabelul 6.6 
Punctele critice d, pentru verificarea exponentialitatii 


۳ - 
0,20 | 0,05 | 0,10 0,05 | 0,01 0,001 
ni <4 
4 | 0,29 0,31 0,34 0,39 ' | 0, 45 | 0,56 
5 27 28 31 34 | 41 49 
6 25 26 28 31 38 | 45 
7 23 24 26 29 36 44 
8 | 22 و2‎ 25 28 34 42 
0 21 22 | 24 27 32 38 
10 20 21 Vn ^ 25 31 37 
12 | 18 20 21 24 | 29 15 
34" i 17 19 20 22 27 32 
16 17 18 i e: Sabie 26 3 
18 16 17 18 20 25 30 
20 15 | 16 17 | 19 24 28 
22 14 15 17 | 19 23 28 
24 14 15 16 ۱ 18 22 27 
26 14 14 16 | 17 21 27 
28 13 14 i 15 17 21 26 
30 13 14 15 | 16 20 24 
Peste | ۳ 
30 | 0,7267/Vn | 0,7672/Vn | 0,8253/Vn | 0,9284//5 1,1385//n |1, 4654///re 


Pentru comparatie consideram alternativele normală gi y?*(1). 

Pent mparatie considerám alternativele lognormalá gi y*(1 

Considerind pragul de semnificaţie de 5% avem tabelul 6.7. 
Tabelul 6.7 


~ ^ 
Compararea puterii testelor Dy si Dy pentru exponentialitate 
la pragul de semnificaţie de 5% 


———————————————————————————— 
| decis. n = 20 
Alternativa p f ` 1 
lognormală o Puterea lui Puterea lui Puterea lui Puterea lui 
D, Da | Da Da 
m 
0,4 0, 73 0, 41 1,00 0,98 
0,6 0,23 0,07 | 0,77 0,52 
0,8 0,11 | 0,02 0,27 0,08 
| ۱ da is TVAE 
1,0 | 0,18 | 0,08 0,24 0,11 
1,4 | 0,47 | 0,24 0,65 0, 44 
2,0 | 0,85 0,61 | 0, 96 | 0, 89 
2,4 0,92 0,78 | 0, 99 0, 97 
Si | A nw JJ YA. 1600 RN 
1 J 
x? (1) | 0,53 | 0,23 ㅣ 0,73 0,44 


6.3.2. Cazui normal 
Veriticăm ipoteza : 


1 des. (x—)3/0* 


Hy: :)ول‎ p, 02) = e"? 
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Statisticile suficiente pentru u si c? sint 
n 


s? = Y (a, — ®). Pentru u fixat,‏ — وا gi, respectiv,‏ € = را 
1 


Flu; y, 0?) = M(Z|z, s?). 


Densitatea de repartitie a lui x, dati x, si s?, este 


1 
ro (n — D} 
세토 paid Mp n 1/5 2 
fale اب‎ de eet 4 
m sio — 2 
2 
1 
p 0 pena 
x 1 Lie SI a ۲ E ai 
2 $ ^ —1 
În consecinţă, Po u; yu, c?) se obţine din relația | 
(6.8) Pola; u, a?) = | f(a, lo, 82) da. 
Avem 
V (wu) 
Bu; py 02) —1— | gn dy, 
0 
1 d - 4 m 1/2 
(u) Bo AUN 
2 8 ^ —1 
T(n — 2) n-— n—2 


Urmeaza că 


D, = max |S,(z) — Foz; y, 0?)| = 


l«i«n 
(6.9) 
= max | S,(2;) — Folz: : 0, |, 
1l«i«n 


unde, pentru fiecare i, 2, este 2, standardizată prin transformarea, 
44 = o2, + p. 
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Tabelul 6.8 


ă 


Valorile critice d, pentru verificarea normalit 


| 
| | 더 Y "Y ff . uy . 9 a 
| E le ۱ In consecinţă JJ, are o repartiție independentă de u si c? şi 
" = putem presupune că u — 0, 5 = 1 în scopul obţinerii repartitiei sale. 
2 Aa و نب‎ ON | GOR ON coo no a "nat Bee; £ 1 4 en vs 
y2 XP test ap ca ene Les: CINE E a S | Srinivasan (1970) respinge ipoteza de normalitate dacă 
o c : | 00 
v 
| Da > da 
T | te unde 4, este dat în tabelul 6.8. 
i| 5 p. SERERE T TII E X Pentru comparație considerăm alternativele lognormală, y? (3), 
~ ~. e si Mp e ola cl metz oru ES y (10), exponențială si uniformă, 
Rn © | „a? ^E ۳ ^ sas . -70/ a 
t Considerind pragul de semnificaţie de 5% avem tabelul 6.9. 
€ LOS Mike SMD YE "m Tabelul 6.9 
— 4 
f ped Nas A ^ 
۳ | = Compararea puterii, testelor bazate pe D, si Dp pentru normalitatea cu œ = 0,05 
p e س ص‎ o 2 هد‎ = Nm OOO OO ES تب‎ one س با توت‎ 
2 ^ 00 00 EN ARAL CI CI. NEN et tet et eo MK TP 
2 g A | co ir = 10 m= 20 
1 pl | 1 ۳ 3 A 
ll 1 Alternativa Puterea lui | Puterea lui Puterea lui Puterea lui 
| i e | A ~ 3 pA 
T3 ANUS GUI RERUM o TAI Dn | Dn Dn | ¡Dn 
p ۳۹ " | | 
3 i l.ognormalá s | 
F4 9 و همه ب مرو وه‎ loans هراق‎ wi i 0,001 | 0,05 | 0,03 | 0,05 0,03 
TE PR سای‎ Aa Vl E Piety wep ROSE | 0, 005 05 | 03 05 03 
Y S | E 0,050 | 05 | 03 07 04 
5 「 | | 0,100 08 | 05 08 06 
El ELE OR A ۱ 0, 500 24 | 17 43 35 
= 1 1,000 15 | 47 83 78 
2 sd 2,000 1 89 | 84 99 99 
9 bo PN سح‎ — "i - — 
Y 시 pci Pag | = | 
g| 3 es EN oa OH CMD be eae seein wate > 5 | 0,37 0,23 | 0,59 0,44 
E E 은 x? (10) BA E 16 800 29 — 
a | | Pi | | 
| | a Il xponentialá | 0:32 | 0,34 0.60 0,61 
g i ii | Sand Sees Y cabs dels s 
ji 00 TI de Oa NEE ۷ "TA. | à | S) 402 
Uniformă | 0, 07 | 0, 07 0,10 | 0,12 
lic 
ae JEN : ae $ OUO Y A A y 
을 RODADO BSE | e Observaţii. i) Schafer, Finkelstein şi Collins (1972) retabelează 
S p pip | = valorile critice pentru D, si D, în cazul exponential. Obtin tabelul 6.10, 
— ۰ 2 ^ ^ ㆍ ㆍ ㆍ 
| | x ] din care rezultă că diferențele dintre D, si D, sint mici si descrese 
1 ATI Di IA. rapid cu creșterea lui n. Pentru n = 20 diferenţa nu se poate distinge. 
» ^ ^ 
ii) Rezultatele comparării puterii testelor bazate pe D, si D, 
| sint date în tabelul 6.11 (la un prag de semnificaţie de 5%). 
سم‎ ~ 
D om o 
2 و ن وه ج ی ها ب‎ |N بو بو و هه ی‎ OM و‎ as Su ۱ | Eos a es. ۲ Ae à SV Et V 
208 A Se ESO E qc ew Pentru alternativa y?, D, este mai puternic decit D,; pentru 
EM : ; AE a 1 s ۳ y " LP 
-9 | alternativa lognormală D, este mai putin puternic (ong, > 1), de 
| egalá putere (oj, 1), sau de putere mai mare (00g+>1) decit 
| Dp. 
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Tabelul 6.10 


Valorile critice pentru Da şi D, in eazul exponential 


x 0,20 0,15 0,10 0, 05 


~ A ~ A ~ ^ ~ ^ 
Da Da Da Da Da | Da Da D, 
n 
3 0,413 0, 451 0,442 | 0,479 | 0,471 0,511 | 0,508 | 0,551 
4 0,377 0,396 | 0,396 | 0,422 | 0,421 0,449 | 0,463 | 0,487 
5 0,346 0,359 | 0,364 | 0,382 | 0,387 | 0,406 | 0,429 | 0,442 
6 0,321 0,331 0,338 | 0,351^| 0,362: | 0,375 | 0,397 | 0,408 
7 0,301 0,309 | 0,318 | 0,327 | 0,340 | 0,350 | 0,373 | 0,382 
8 0,285 | 0,291 0,300 | 0,308 | 0,322 | 0,329 | 0,353 | 0,360 
9 0,271 0,277 | 0,985. |. 0,291 0,305 | 0,311 | 0,335 | 0,341 
10 0,259 0,263 | 0,272 0,277 | 0,291 0,295 | 0,321 | 0,325 
11 0,247 | 0,251 0,261 0,264 | 0,279 | 0,283 | 0,307 | 0,311 
12 0,238 0,241 0,251 0,254 | 0,269 | 0,271 | 0,296 | 0,298 
13 0,829. 1| 0,232 0, 242 0,245 | 0,258 | 0,261 | 0,285 | 0,287 
14 0,221 0,224 | 0,233 | 0,237 | 0,249 | 0,252 | 0,275 | 0,277 
15 0,215 | 0,217 | 0,227 | 0,229 | 0,242 | 0,244 | 0,266 | 0,269 
20 0,188 | 0,188 0,198 | 0,199 | 0,212 0,212 | 0,234 | 0,234 


Tabelul 6.11 


Compararea puterii testelor bazate pe Da si Da pentru exponentialitate la 
pragul de semnificaţie de 5% 


Hnc n = 10 n= 20 
Alternativa s | ^ 2 | ‘ A A 
i D, D, Dé D D, 
Lognormalá 
Sige 0,4 0,39 0, 58 0, 90 0, 95 1,00 | 1,00 
0, 6 0,13 0,24 0,37 0,48 0,80 0, 85 
0,8 0,06 0,10 0,12 0,16 0,25 0,30 
1,0 0,07 0,07 0,11 0,09 0,15 0,14 
1,4 0,18 0,13 0,31 0,26 0,49 0,45 
2,0 0,39 0,31 0, 67 0, 61 0,90 | 0,89 
2,4 0,51 0,42 0,81 0,77 0,97 0,97 
(1) 0,18 0,13 0,30 0,25 0,48 | 0,44 


a 


6.4. Repartitille limită ale statisticilor ۶ Da si n"? D, 


Moore (1973) arată că atit in cazul exponential, cit si în cazul 
normal cele două estimatii ale functiei de repartiție satisfac 


(6.10) sup (n!-*| F(z|0,) — F(x) |} = 0 
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u probabilitatea 1, pentru orice 3 > 0 si pentru toate alternativele 
iebriviale cit si in ipoteza nulă. 

Me pot face douá observatii. y 

Mai întîi, Durbin (1972) a arătat că w'?(F,(x) — P(v|0,)) con- 
orge slab către un proces gaussian. Rezultatul (6.10) cu 3 = 1/2 
ite suficient pentru a arăta că 


۱ 


nU) — F(»19,) 


we aceeasi limitá. Deoarece Durbin dovedeşte convergenta atit in 


sirul ipotezelor alternative, cit gi in ipoteza nulă, 


^ ~ 
pie i 00378 
nD, Si nD 


ıu repartitii limită identice in amîndouă situațiile. 
În al doilea rînd, valabilitatea lui (6.10) nu depinde de regulari- 
ite în cazul exponential si normal. Pentru a ilustra aceasta Moore 


(1973) presupune că X, sint repartizate uniform pe (0, 0), 0— 0 


fiind necunoscut. Atunci 0, = T, = max (X,) şi 
F(x/0,) = v[max (X,) pentru 0 > x > max (Xj), 
timp ce : 

F,(2) =(1 — Lin) F(%10),) pentru acelaşi domeniu al lui ۰ 
istfel (6.10) are loc pentru orice repartiție a lui Y; pentru care 
max(X,) > ۰ 

Deci (6.10) pare să aibă loc pentru ipoteze nule generale. 


6.4.1. Cazul exponential 


Presupunem că in ipoteza nulă X,, Xa, ... au densitatea data 


(2.5.1). 


A e 


O pos WES 
۲ ۸ 7 wy : 
F(x10,) = 1 — exp(— 2/X), «> 0, 
estimatorul Srinivasan este 
(x) = {1 — and, 0 > 2 < ۰ 


Prin urmare 


^ E | = æ aa 
sup |F(x2/0,) — F,(z)| = max 4 sup e-*"^ — t "4 TAE oa e 
Alo O<x<nX | nA | 


Astfel (6.10) va avea loc pentru orice repartiție a lui Y, cu X < 0, 


dacă putem arăta că pentru orice 3>0 


(6.11) sup feth (: «JI i 
n 


O<u<n 
Cazul u — 0 nu creează neplăceri. Dacă u = y este un extrem al 
expresiei į 


exp(—4) — (1 — ujn) in 0 > u< n, 


derivata acestei funcţii se anulează în Y. Deci 


exp(—y) = (1 — y[ny*-!, 
astfel încît 


| 4 n ۳ 
(6.12) e- dl ( E x] | zd A ik 
| 


si cu aceasta rezultă (6.11). 


6.4.2. Cazul normal 


Presupunem că X,, X,, ... 


1 i au o repartiție N(u, o), astfel încît 
0 = (u, o2). Atunci 


(Au 2), unde 2 — RSC E‏ = ,6 = ی[ 
Densitatea, de repartiție a lui X, dat T, = (Z, s2) este‏ 


Oy ام‎ i $ 
I (^ 7 7) A m 4) 
$ 2 ] Vez S 
Falo, s?) Von: cw heer ee ane, eit 1 (E z y 
n(n — ser [> n — 1) ۴ na ۰ 
cînd 
|(@ — 2)/s| < (n — 1)? şi 0 în rest. 
Fie 
1 
0 (== blt) — —- 
í 2 


Din estimatia lui si simetria lui f(z| 2,5?) faţă de x = rezultă 
cá pentru a stabili (6.10) sub orice repartitie a lui X, trebuie să studiem 
numai 


a 


TR 
e | (1 —— ) du — (d), 


sup 
0«4«(u—1). 


2 ^ —1 
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unde C, este constanta de normalizare din f(w|F, s2). Avem 


^ a 1 
n— 1112 nm — 2۵ ۶ u? E "4 
(^ 9 매서 D, OP ~ a di E O AA du< 
۰] e E a Vu) و‎ 
0 


n — 1 \!2 n — 4 ۶ 
< 0, | 2 ——— 00:10 3 
T uu | [20] | 


Folosind (6.12) şi primii termeni din dezvoltarea in serie a lui I(x) 


1/2 ارو 
d, (7 " z) = 1 + 0(1/n)‏ 


m سب‎ 2 


n — 92 ۶ 
olaf ) a ,(a) = 00170) 
n— i1 


obținem că 


uniform in a. Pentru marginea superioară se obțin rezultate asemă- 
nătoare, astfel încit are loc (6.10). 


6.5. Teste Kolmogorov-Smirnov pentru exponentialitate 


Fie Y, Y, ..., Y, o selecţie asupra variabilei aleatoare Y 
vind funcţia de repartiție G. Ne propunem să verificám ipoteza 


1 
(6.13) Hy: G(y) — 1 ex» | ^ (7. 2] &«3-—o0,050 


unde 0 (si posibil «) este necunoscut. 
Dacă « este cunoscut, luăm X, = Y,— «, j = 1,2, ...,- si 
H, este echivalentă cu 


(6.14) Ha cuim 1 exp ( o) 0O<x<o,0>0 


Dacă « este necunoscut luăm valorile %1, ..:, 2,., In şir ca 


Vi — Ya» ولا‎ Ja» ۰ ۰ Ya — Ja» Yay = MINY, Yo, ۰۰۰ Yn) 


după ce am înlăturat pe zero. Vom presupune că ya) este unică cu 
probabilitatea unu. X,, Xs, ..., X,., este o selecţie de volum n — 1 
din (6.14). Prin urmare, in amîndouă cazurile avem de verificat ipo- 
teza (6.14) cu 0 necunoscut gi n — 1 înlocuind pe n cind a este necu- 
noscut. 
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Pentru a verifica, ipoteza (6.14) folosim statistica 
(6.15) D,(0) = max{D+(6), D,(8)! 


unde 


(6.16) 


» 


0:0 = max [fi xx, -—- | 


ae و اه‎ NEC. aed ri ㆍ 1/ ^ 
Punctele percentilice ale statisticilor | » Di, l| »Dz si VD, sini 
date in tabelele 6.12, 6.13 si respectiv 6.14. (Durbin (1975)). 


$. 


7. Testul Kolmogorov-Smirnov pentru normalitatea erorilor 
experimentale într-un bloc aleator. 


Considerăm un bloc aleator cu a tratamente si b blocuri. Presu- 
punem că cele ù — ab observaţii pot fi descrise de modelul liniar 
(7.1) Yi, pt وین‎ + en pliu A NE PUNIRI ACAD A ate 
unde 

- a; este efectul nealeator al tratamentului 1 supus la restrictia 
y a; 0, 

— u, este media blocului j care poate fi aleatoare, 

— desi وا‎ ...,45 ) =1, ...,b} sint erorile experimentale 
independente si identic repartizate cu funcţia de repartiție F si 
M(e,) = 0. RA i 

Pentru un număr fixat de tratamente, pentru b — co, pentru 
toți x si pentru unii o> 0, considerăm ipoteza 
(7.2) Ha: Bia (26): 

Erorile experimentale rezultate nu sînt observabile si de regulă 
sint estimate prin 


Y, E N , 


9 
unde 
Y;. este media tratamentului i, 
Y.; este media blocului j, iar 
Y.. este media generală. 


Constance L. Wood (1978) foloseşte pentru verificarea ipotezei 
H, rezidurile normalizate 


ey = dalla — DPUY y + Y. — Y; + Ye) 
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átii (media necunoscută) 


Tabelul € 
pentru ver 


+ 


1 


nh, 


tatisticii 


ale s 


incit 


tel 


d as 


valori 


Punctele percentilice 


sint 


Intrárile 


110) 


10 


10 
1 


FEI 


کک ت چب لتت اټ تت تسج — > Tuae cine‏ ————— 


Tabelul 6,13 


Punetele percentilice ale statisticii Vn D, pentru verificarea exponentialitátii (media necunoseută) 


20 | 50 80 90 95 99 99,9 


P 
0,1 1 5 10 
n 
| 


SET 


0,8934 |. 0,8887 | 0,8673 | 0,8392 | 0,7778 | 0,5564 | 0.4719 | 0,4525 | 0,4422 | 0,4338 | 0,4319 
1,0742 | 1,0278 | 0,9352 | 0,8579 | 0,7420 | 0,5862 | 0,4352 | 0,4054 | 0 ) | 0,3652 | 0,3525 
1,1869 | 1,0874 | 0,9377 | 0,8554 | 0,7585 | 0,5764 | 0,4194 | 0,3825 | 0 0,3334 | 0,3140 
1,2534 | 1,1078 | 0,9502 | 0,8620 | 0,7560 | 0,5702 | 0,4123 | 0,3680 | 0 0,3145 | 0,2916 
1,2911 | 1,1216 | 0,9554 | 0,8652 | 0,7569 | 0,5685 | 0,4162 | 0,3573 | 0 0,3011 | 0,2766 
1,3125 | 1,1329 | 0,9603 | 0,8674 | 0,7577 | 0,5674 | 0,4184 | -0,3492 | 0,3232 | 0,2907 | 0,2655 
1,3294 | 1,1408 | 0,9636 | 0,8693 | 0,7581 | 0,5665 | 0,4186 | 0,3443 | 0 0,2822 | 0,2568 
1,3426 | 1,1472 | 0,9664 | 0,8707 | 0,7585 | 0,5658 | 0,4181 | 0,3481 | 0 0,2750 | 0,2495 
1,3529 | 1,1523 | 0,9686 | 0,8719 | 0,7588 | 0,5654 | 0,4173 | 0,3511 | 0 0,2687 | 0,2434 
1,3686 | 1,1601 | 0,9721 | 0,8738 | 0,7594 | 0,5649 | 0,4158 | 0,3538 | 0,2996 | 0,2577 | 0,2332 
1,3799 | 1,1658 | 0,9746 | 0,8752 | 0,7598 | 0,5644 | 0,4144 | 0,3543 | 0,3054 | 0,2481 | 0,2249 
1,3885 | 1,1702 | 0,9765 | 0,8763 | 0,7601 | 0,5640 | 0,4133 | 0,3540 | 0,3084 | 0,2394 | 0,2176 
1,3952 | 1,1736 | 0,9781 | 0,8771 | 0,7604 | 0,5637 | 0,4126 | 0,3534 | 0,3099 | 0,2312 | 0,2112 
1,4007 | 1,1764 | 0,9793 | 0,8778 | 0,7606 | .0,5635 | 0,4124 | 0,3527 | 0,3105 | 0,2258 | 0,2053 
1,4052 | 1,1788 | 0,9804 | 0,8784 | 0,7608 | 0,5633 | 0,4125 | 0,3520 | 0,3106 | 0,2312 | 0,1997 
1,4090 | 1,1807 | 0,9813 | 0,8789 | 0,7609 | 0,5632 | 0,4126 | 0,3515 | 0,3104 | 0,2353 | 0,1945 
1,4123 | 1,1824 | 0,9821 | 0,8793 | 0,7611 | 0,5631 | 0,4126 | 0,3511 | 0,3101 | 0,2384 | 0,1894 
1,4152 | 1,1839 | 0,9827 | 0,8797 | 0,7612 | 0,5631 | 0,4126 | 0,3510 | 0,3097 | 0,2407 | 0,1846 
1,4177 | 1,1852 | 0,9833 | 0,8800 | 0,7613 | 0,5630 | 0,4126 | 0,3511 | 0,3093 | 0,2424 | 0,1799 


1,4228 1,1879 0,9846 0,8807 0,7616 0,5629 0, 4124 0,3519 0, 3086 0, 2449 0,1688 
1,4267 1,1900 0,9855 0, 8812 0,7617 0,5628 0, 4124 0, 3522 0, 3088 0, 2459 0,1741 
1,4298 1,1916 0, 9863 0,8817 0,7619 0, 5627 0, 4125 0, 3523 0, 3098 0, 2460 0,1801 
1,4325 1,1930 ! 0,9869 0, 8820 0, 7620 0, 5627 0, 4126 0, 3524 0, 3103 0,2457 0,1845 
1,4365 1,1951 0, 9878 0, 8826 0, 7622 0, 5627 0, 4128 0,3526 0,3108 0, 2450 0,1898 
1,4394 1,1967 0,9886 0, 8830 0, 7623 0, 5627 0, 4129 0, 3530 0,3111 0, 2464 0, 1922 
1,4418 1,1979 0, 9891 0,8833 0, 7624 0,5627 0, 4131 0, 3533 0, 3115 0,2478 0,1930 
1,4436 1,1989 0, 9896 0,8835 0, 7625 0,5627 0, 4132 0,3536 0,3120 0,2486 0,1929 
1, 4452 1,1997 0, 9900 0, 8837 0, 7626 0,5627 0, 4133 0,3538 0,3124 . 0,2491 0,1924 


Intrările sint valorile d astfel încît P(/n Da >d) = P/100 


Tabelul 6.14 


Punctele percentilice ale statisticii yn D, pentru verificarea exponențialității (media necunoscută) 


P) 
0,1 1 5 
| 


10 | 20 30 50 70 80 90 95 


6 > 9 


2 0,8934 | 0,8887 | 0,8673 | 0,8392 | 0,7788 | 0,7119 | 0,6133 | 0,5115 | 0,4719 | 0,4525 0, 4422 
3 1, 0905 1,0398 | 0,9540 | 0,8852 | 0,7808 | 0,7140 | 0,6313 | 0,5483 | 0,5022 | 0,4407 | 0,3982 
4 1,2429 | 1,1148 | 0,9687 | 0,8884 | 0,8014 | 0,7369 | 0,6326 | 0,5531 0,5090 | 0,4561 0,4144 
5 1, 3001 1,1464 0, 9884 0,9044 0, 8056 0, 7418 0, 6434 0, 5553 0,5121 0,4589 | 0,4212 
6 1, 3466 1,1631 1,0007 | 0,9141 0,8133 | 0,7459 | 0,6479 | 0,5610 | 0,5148 | 0,4611 | 0,4227 
7 1,3708 1,1797 1,0084 1,9211 0,8196 | 0,7508 | 0,6504 | 0,5651 0,5189 | 0,4630 | 0,4244 
8 
9 

10 


1,3897 1,1902 1,0153 0,9260 0, 8241 0, 7554 0, 6530 0,5674 0, 5219 0, 4657 0, 4260 
1,4037 1,1986 1,0212 0, 9303 0, 8275 0, 7587 0, 6557 0, 5691 0, 5239 0, 4682 0, 4279 
1, 4146 1,2057 1,0258 0, 9343 0, 8303 0, 7613 0, 6584 0, 5708 0,5254 0, 4700 0, 4299 


12 1,4315 1,2164 1,0327 0, 9402 0, 8351 0, 7653 0, 6623 0, 5741 0,5281 0, 4726 0,4328 
14 1.4435 1,2243 1,0381 0,9446 0,8390 0, 7687 0, 6652 0, 5770 0, 5306 0, 4746 0, 4348 
16 1,4526 1,2304 1,0424 0,9482 0, 8420 0,7716 0,6675 0,5793 0,5329 0,4764 0, 4364 
18 1,4597 1,2352 1,0458 0,9511 0,8444 0,7738 0, 6695 0,5810 0,5347 0, 4782 0, 4378 
20 1,4656 1,23% 1,0486 0,9536 0,8465 0.7757 0,6713 0,5826 0,5362 0,4797 0, 4392 
22 1,4704 15 1.0511 0, 9557 0, 8484 0,7774 0,6728 0, 5839 0,5374 |” 0,4810 0, 4405 
24 1,4745 EP 1,0531 0, 9575 0, 8499 0,7788 0,6741 0, 5852 0,5386 0, 4821 0, 4416 
26 1,4780 1, 1,0549 0, 9591 0, 8513 0, 7801 0, 6753 0, 5863 0,5396 0, 4830 0, 4425 
28 1, 4810 1,2500 1,0565 0, 9605 0, 8525 0, 7813 0,6763 0,5873 0, 5405 0, 4839 0, 4434 
30 1,4837 1,2519 1,0580 0,9617 0,8537 0, 7823 0,6772 0, 5881 0,5414 0, 4847 0, 4441 


1,0609 0, 9644 0, 8560 0, 7845 0,6793 0, 5900 0,5432 0, 4864 0,4458 


35 1.4891 é 
40 1, 4933 1,0633 0, 9665 0,8579 0, 7862 0,6809 0,5915 0,5447 0, 4879 0, 4472 
45 1,4966 1,0652 0, 9682 0,8594 0,7877 0,6823 0, 5928 0,5460 0, 4891 0, 4484 
50 1.4996 1,0668 0,9696 0, 8608 0, 7890 0, 6834 0, 5939 0, 5470 0,4901 0, 4494 
60 1,5053 1,0694 0,9720 0,8629 0,7910 0,6853 0,5957 0,5488 0, 4918 0,4510 
70 i 1,0714 0, 9737 0, 8645 0,7925 0, 6868 0, 5971 0, 5502 0, 4931 0,4523 
80 t 1,0729 0, 9752 0, 8658 0, 7938 0, 6880 0, 5983 0,5513 0,4942 0, 4534 
90 * 1,0742 0, 9764 0, 8669 0, 7949 0, 6890 0, 5992 0, 5522 0,4951 0,4543 
100 * 1,0753 0, 9773 0,8678 0, 7987 0,6898 | 0,6000 0,5530 0, 4959 0, 4550 


Intrárile sint valorile d astfel incit P (n D,7 d) = 0 
* Valoarea nu este disponibilă 


Dacă o? ar fi cunoscut, În ipoteza H, 
ele ~ N(0, (b — 1)/0). 


si deci pentru a fixat, cînd b — oo, 0(e;;/a) este uniformă pe [0,1] 
dacă si numai dacă are loc (7.2). Deoarece c? este necunoscută şi 
nespecificatá în (7.2) va fi estimată de 52, media pătratelor reziduală. 

Procedeul ی‎ in calcularea mai intii a funcției de repartiție 
de selecţie a variabilelor 


fale. A is ba ee 사사 
peA: ES ERRAR و‎ E ois ique AD 
adica 


G,({t) = {nr. de 6/2, > t)/n, 0 « i « 1. 


Atunei statistica Kolmogorov-Smirnov este dată de 


(7.3) D, = sup n/a (t) 


Ostsi 
Valorile mari ale lui D, indică dezacordul dintre funcţia de repartiție 
uniformá si G, estimatorul său nedeplasat si deci conduc la respinge- 
rea ipotezei (7.2). In fapt, regiunea de respingere asimptotică este 
/ den euantilele repartitiei limită a statisticii D,. 
u 


QUIS dS Bye DA Em usse My, 


unde (X, Y) are o repartiție normală bidimensională cu 


۹ YT = LÁ IM RE 는 eo 
[ho u 0, 0, oy = 1, Say Ps 
are loc 

Teorema 7.1. (Constance Wood (1978). În ipoteza 176, repartitia 


limită a lui D, este aceeasi cu a statisticii 


| V(t) 


unde V este un proces gaussian cu 
Mi Ve) 0. Dies sb. 


svpentru 0 ss, tal, 


M(V?(t)V9(s)) = min(s, t) — st + (a L) [eof o-(s), 0-11) 
(1.4) 
mil | a : ; 
pe A st] —— | e2(1)6-1(8)0' (071(1))9 (6-1(8)). 
La— 1 


Observaţii. Funcţia de covariantá a lui VO si deci repartiţia, 
limită a lui D, depinde de a, numărul tratamentelor. Cuantileie 
pentru aceste repartifii sint date în tabelul 7 
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Cuantilele asimptotice pentru statistica Kolmogorov-Smirnov 


pentru o selecție cu media estimată X si 
date în tabelul 7.1 în coloana «.— oo. 


dispersia estimată S? sint 


Tabelul 7.1 


P enantilele testului Kolmogorov— Smirnov pentru normalitate într-un bloc 
aleator cu a tratamente 


RT 


| | | 
P | a= 3 | a 4 | a=9 | a= 00 
| | | | 
| i | | | 
0, 100 0, 4087 | 0,4119 | 0,4125 | 0,4144 
0,200 0, 4548 | 0, 4565 | 0,4579 | 0, 4581 
0, 250 | 0,4957. . | — 0,4987 -| 0,4775 | ^ 10,4792 
0, 500 0, 5608 | 0, 5635 | 0,5662 0,5669 
0, 750 0,6677 | 0,6710 | 0,6757 | 0, 6759 
0, 800 | 0,6977 | 0,7011 0,7065 | 0,7077 
0, 850 | 0, 7339 | 0, 7369 | 0, 7419 | 0, 7444 
0, 900 | 0, 7743 | 0, 7808 | 0, 7867 0, 7898 
0, 950 | 0, 8460 | 0,8585 | 0, 8657 0, 8628 
0, 975 0,9120 | 0,9220 | 0, 9309 | 0, 9390 
0, 990 | 1,0119 | 1,0091 | 1,0230 | 1,0440 


8. Statistici Kolmogorov-Smirnov pentru date 
trunchiate si censorizate 


8.1. Date trunchiate 


Presupunem că selectia AX, X2, ..., Xa asupra variabilei alea- 
toare X cu funcția de repartiție F continua este trunchiată, deci că 
observaţiile sint 2, ..., Xp, unde X; = min(Y,, T), T fiind un timp 
de trunchiere arbitrar, însă fixat. Acesta este cazul in care în scopul 
testării duratei de viaţă a unui produs sînt puse să funcţioneze N 
produse si fiecare este observat pînă la un anumit timp de trunchiere 
sau pînă la detectare (dacă timpul de defectare este mai mic decit cei 
de trunchiere). Într-o astfel de situaţie dacă dorim sá verifieám 
ipoteza 
(8.1) HOF =W 


unde F, este o funcție de repartiție continuă specificată, modificám 
statistica Kolmogorov-Smirnov ; considerăm statistica 
(8.2) DN: T sup Pata) — FQ). 
-oocxc-T 
Barr, Davidson (1973) dau tabelele 8.1 si 8.2 cu repartiția exactă 
a statisticii (8.2) pentru N 5(5)30 si pentru diferiţi timpi de trun- 
chiere. 
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BET 


Tabelul 8 


u 


Pragurile de semnificatie ealeulate pentru selecţii eensorizate (n = volumul selecţiei, f = numărul observațiilor, 
k[n — valoarea eritieá). 


n =10 
k 1 2 3 4 5 
pw 
1 0, 67232 0,92224 0, 98976 0, 99967 0,99999 
2 |.  0,28000 0, 87104 0, 98496 0, 99968 1, 00000 
3 0,12160 0, 78752 0, 98496 0, 99968 ~~ 4, 00000 
4 0, 05760 0, 72960 0, 97824 0, 99968 1. 00000 
5 0, 03840 0, 69120 0, 96992 0. 99936 1, 00000 
3 
7 
1 0, 65132 0, 89262 0, 97175 0, 99395 0, 99902 
0, 99989 0, 99999 1, 00000 1, 00000 1,00000 
2 0,25320 0,81192 0,94152 0, 98614 0,99771 
0,99977 0,99999 1, 00000 1,00000 1,00000 
3 0,09911 0, 68126 0, 91515 0,97906 0.99668 
0,99972 0, 99999 1, 00000 1, 00000 1,00000 
4 0,03914 0, 55947 0, 88112 0,97392 0,99618 
0,99971 0, 99999 1, 00000 1700000 1, 00000 
5 0, 01564 0, 46168 0, 83988 0, 96953 0, 99611 
0, 99971 0, 99999 1, 00000 1,00000 1,00000 
6 0, 00635 0, 38556 0, 80282 | 0, 96331 0, 99596 
0, 99971 0, 99999 1,00000 1,00000 1,00000 
7 0,00265 0, 32827 0,77438 0, 95596 0, 99516 
0, 99970 0, 99999 1, 00000 1,00000 1,00000 
8 0,00115 0, 28842 0, 75368 0, 94895 0, 99391 E 7 
0, 99963 0, 99999 1,00000 1,00000 1.00000 
9 0, 00054 0, 26563 0, 73821 0, 04368 0, 99279 
0, 99951 0, 99998 1, 00000 1,00000 1.00000 
10 0, 00036 0, 25128 0, 72946 0, 94101 0; 99222 E eae 
0, 99943 0, 99998 1, 00000 1, 00000 1, 00000 
An'sz 15 
k 1 2 3 4 5 
oa del 7 8 9 10 
A AA تسس سس‎ 
1 0, 64473 0, 88310 0, 96481 0, 99045 0, 99771 
0, 99952 0, 99991 0, 99998 0, 99999 0, 99999 
Im 0,24576 0, 79514 0, 92578 0, 97675 0, 99379 
0,99862 0, 99975 0,99996 0.99999 0, 99999 
^ 3 | 0,09394 0,65514 0, 88982 0,96212 0,98918 
0,99750 0, 99955 0, 99993 0, 99998 x 0, 99999 ㆍ 
ae 0, 03602 0, 52460 0, 84326 0, 94813 0, 98457 
0,99640 0, 99937 0, 99992 0, 99998 : 0, 99999 
A ET 0, 41916 0,78520 0, 93326 0, 98045 ۱ 
0, 99549 0, 99925 0, 99991 0, 99998 ; 0, 99999 
6 0, 00536 0, 33562 0, 72783 0,91412 0,97684 
0,99486 0,99919 0, 99991 0,99998 & 0,99999 
7 0, 00208 0, 26985 0, 67530 0, 89308 0,97277 | _ 
0,99450 0,99918 0,99991 0, 99999. 0, 99999 
IE 0,00082 | _ 0,21822 0,62879 0,87270 0,96810 | - 
0,99413 0,99917 0,99991 0,99998 0.99999 _ 
9 0, 00032 0117779 0, 58861 0, 85455 0, 96331 
0, 99347 0. 99914 0, 99991 0, 99999 0, 99999 
10 0, 00013 E 0,14631 0, 55494 ~ 0, 83946 0, 95870 | 
0,99250 0, 99905 0, 99991 0, 99999 0, 99999 
11 | 5 ۲ 0,12206- 0, 52806 0, 82755 0, 95438 
0,99140 0, 99888 0, 99990 j 0, 99999 0, 99999 
12 0, 00002 |; "0, 10388. 0, 50827 0, 81793 0, 95064 
0,99035 0, 99869 0, 99988 ۳۷ 0, 99999 0, 99999 
“18 0, 00001 0,09125 0, 49415 0, 81038 | 0,94777 
0,98953 0, 99852 0,99986 | 0.99999 __0,99999 — 
14 0, 00000 0, 08404 S 0, 48377 0,80523 | 0, 94594 
0,98902 0, 99841 0, 99984 0, 99999 1, 00000 
15 0, 00000 0,07950 0, 47795 0, 80275 0, 94517 
| | 0,98882 Q, 99837 Q, 99983 0, 99999 | 1, 00000 


Tabelul 8.1 (continuare) 


n=20 z | 
hom 1 2 3 1 | 1252: | 
as IE. 7 8 ko Seay 
| 
1 0,64151 0, 87842 0, 96123 | 0, 98846 0, 99681 
3 0, 99919 0, 99980 0, 99994 | 0,99997 0, 99998 
3 | 0,24237 = 0, 78722 0, 91799 E 0, 97155 | ^ | 0,99112 RS 
Lr REQUE E 0, 99751 0,99937 0, 99985 0, 99996 0, 99598 
3 0, 09163 0, 64328 |. 0, 87783 0, 95298 ` 0, 98398 - 
0,99520 0, 99874 0,99971 0,99993 0,99997 
4 0, 03471 0, 50956 0, 82612 Sa ET Orel a 
0,9925: 0, 99798 0, 99953 0, 99990 0, 99997 
dr اس مت ی 4 واه ی‎ E -E- 
5 | 0,01317 0.40200 0, 76163 0, 91448 0, 96853 
로 오아 a ac 0,98975 0,99718 0, 99935 | 0 99987 0, 99996 
6 | 1 0.31713 0, 69734 A RRĂBA | A 0,96080 | s 
fe AN 0, 98708 0, 99643 0.99919 0. 99984 0.99996 
7 | 0,00191 0,25053 0, 63757 ^ 0,85935 — | 0,95180 | REUS. 
Hop UE 0, 99577 0, 99906 0. 99983 0, 99996 
8 0, 00073 0, 19831 | 058334 AO I B 0,94128 | pas 
TAE — | 0.98215 0,99526 | 0,99898 0, 99982 0, 99996 
9. | 0.000284 0, 15748 0,53468 | 03001 |, ~ c 02990087 c 
ار ده‎ N 97940 0,998 0, 99982 0, 99996 
10 0, 00011 | 0,12544 tes 0,7337 Abs 3 


0, 00004 


0, 97641 


0, 49130 


0, 99892 


0, 10032 
0, 97333 


0, 99392 


0, 45287 


0, 99888 


0, 74859 


0, 99982 


0, 99982 


0, 00002 


Û, 08063 


0,97033 0, 99329 


0, 41906 


0, 99880 


0, 72646 


0.99981 


0, 91863 


0.90789. 
0, 99996 


0, 89818 
0, 99996 


0, 00001 


0,06519 


0,96751 | 0,99255 


0, 38964 


0, 99867 | 


0, 70720 


0, 99980 


0, 88976 


14 | 0,00000 | | 0,05311 | 0, 36443 0, 69100 0,88268 | zu 
DEE EL YE 0, 99177 0, 99850 0, 99978 0.99998 
و‎ ^ 0, 04370 0, 34340 0.67795-|- ^ - 0.87080 SS 
| 0, 96251 0, 99101 0, 99833 0, 99975 0, 99996 
Cum MESES و‎ UN VENUE Ep di NAROA 
a | 1 | 2 3 4 2 
f xl 6 | 7 8 9 1 me 
3646 32665 0, 66783 0,87184 
1( 0, 00000 0,03646 0,32 s > AE TUE 
: | 0,96049 0, 99036 0, 99816 0, 99972 0, 99996 
raa „0310: 314: 15979 0, 86785 
0, 00000 0, 03103 0,31434 0, 65 x E 
E 0, 95890 0, 98984 0, 99803 0, 99970 0.99996 
شب‎ - = ET Y E 30558 p 35354 | 0, 86493 
8 0, 00000 0,02726 0, 30558 0,65354 - A 1 
: dis 0, 95780 0, 98949 0, 99794 0,99968 0, 99996 
i9 or00000. |, - , 0,02510 0, 29914 0. 64931 0, 86312 e 
| 0,95716 0, 98930 0, 99789 0, 99967 0, 99996 
“ear GE Wn i 2955: 34728 ES 0, 86237 E 
2 | 0.00000 0, 02374 0,29553 0, 64728 A , 862: i 
| 0, 95693 0, 98924 0, 99787 0, 99967 0, 99996 
09589 | SA ooo HT 
TES 25| | E 
gs k 1 | 2 3 4 5 
ie | | 6 7 8 9 10 
Li 2: eet و رت رس‎ ———————————————— ~ ” 99620 
S 0, 87563 0, 95906 0, 98719 : 0, 9962 - 
= 0, 99893 0, 99970 0,99991 0,99996 0,99997 
VOS d Ee E 1-09 1852 0, 96830 0, 98931 
^ | 0,099667 0, 99903 0, 99973 0, 99991 0.99996 - 
OOO | 15063800 37087 x 740 | - 0, 98052 
3 Q; 09031 0,63650 0,87087 0, 94740 š 
i ), 99343 0.99798 0499943 | 0; 99984 0.99994 
| 0,9934: ). 9974 994: E 
cur Pres — ~ e 26 0, 97079 
/ | 0,03399 0,501106 0, 81639 0,92644 : Y ; 
ges 0. 98054 0, 99663 | 0.99902 0, 99973 0, 99692 
AS TS ca E xs m es میس‎ ~ x 
eee p = ve E 0, 74856 0, 90351 0,96075 s 
| 0,972 0, 99507 0, 99853 0. 99960 0, 99989 
OD, ZU a AD] | 0,068088 7 0,87399 0, 95043 g 
s ; 0.98798 | | -0,99342 0.99801 0,99946 0, 99985 
| | 9; „99342 __|__0.99801_ 3 E ES 
Ev ned BOT 771.71 < Bike yt ei 11785 34046 0, 93829 
5 j, 00182 | 0, 24078 0, 61785 | 0, 84046 : 
Mt ~ | 0.9744 CA O 99177 0, 99748 0, 99933 0, 99983 
$5 TIN | E O, 56049 3057 0,92397 | - 
8 | 00069 0. 56049 0, 80579 , 92 : 
x | ate 0.971 0, 99699 0, 99920 0, 99980 
«0i | ori 
DEM | 1 8 rt { ^) TRA E =: mn” aa 0, 00820 
E 9 0, 00026 P 0, 50876 0, 99655 0, 77166 0,60910 0.99979 


err 


Tabelul 8. 


1 (continuare) 


10 0, 00010 0,11656 0, 46231 0, 73893 0, 89181 

0, 96060 0, 98704 0, 99681 0, 99903 0, 99978 
11 0, 00004 0, 09184 0, 42071 0, 70806 0, 87546 

0, 95428 0, 98532 0, 99584 0, 99897 0, 99977 
12 0, 00001 0,07252 0, 38352 0, 67924 0, 85963 

0, 94785 0, 98348 0, 99550 0, 99893 0, 99977 
13 0, 00001 0, 05740 0, 35034 0, 65256 0, 84465 

0, 94155 0,98158 0,99513 0,99890 0, 99977 
14 0, 00000 0, 04557 0, 32081 0, 62808 0, 83078 y 

0, 93560 0, 97969 0, 99470 0, 99883 0, 99976 
15 0, 00000 0, 03630 0, 29461 0, 60582 0, 81818 

0, 93014 0, 97786 0, 99423 0, 99874 0, 99975 
16 0, 00000 0,02903 0,27146 0,58582 0, 80699 

0,92528 0,97613 0, 99373 0, 99863 0, 99974 
17 0, 00000 0,02333 0,25113 0,56813 0, 79729 

0,92104 0, 97452 0,99320 0,99850 0, 99971 
18 0, 00000 0,01886 0, 23346 0,55283 0, 78911 

0,91738 0,97303 0, 99270 0, 99836 0, 99969 
19 0, 00000 0,01537 0,21833 0; 54000 0, 78238 

0,91423 0,97171 0,99221 0, 99824 0,99966 
20 0, 00000 0,01265 0, 20572 0,52969 0, 77686 
~ 0, 91153 0, 97059 0, 99184 0, 99812 0, 99964 
21 0, 00000 0,01055 | 0, 19568 0, 52170 0, 77229 TS 

0,90933 0, 96968 0,99153 0, 99803 0, 99962 
22 0, 00000 0, 00898 0,18830 0, 51536 0, 76864 

: 0, 90766 0, 96903 0, 99131 0,99797 0, 99960 

23 0, 00000 0, 00789 0, 18304 0, 51045 0, 76598 

0, 90652 0, 96861 0,99118 0,99793 0, 99959 
24 0, 00000 0, 00726 0,17918 0,50713 0, 76435 
ange 0, 90587 0, 96839 0,99111 0, 99792 0,99959 
25 0, 00000 0, 00687 0, 17702 ` 0,50553 0, 76367 

0,90564 0, 96832 0,99109 0, 99791 0, 99959 


ES ۱ 0, 99578 
; 378 0, 95760 0, 98633 a > 
1 0, 63833 ds 0,8737 eds 0, 99990 0,99997 0,99998 
: 11 0, 98804 
: : 7958 0,91030 0,966 
2 a aos 9: 295۶ وی و‎ 0, 99964 0, 99989 0, 99996 
E 8947 ? 0,63210 0, 86632 0, 94367 0078 ی‎ ia 0.99993 
E aa ah Ge e 0, 99737 0, 99919 0, 99976 et 
pex LL 5 ), 96700 
e 2 13 0, 92108 0, 개 
4 0, 03353 ۲ 0, 49579 ala 0, 810 0.99854 0,99956 0, 99987 
,98732 „99552 E 0,95542 
— ad RAR 0, 74023 0, 89636 ۰ و‎ 
5 0, 01257 Moss 0,38683 | ps 7 나 aes 0, 99980 
, 9816 وا ارف‎ dee 1۰ کو‎ ay 0, 94340 
a = : > 7056 0, 86460 , 
; eim 0,97630 9,29143 | و‎ 90008 is 0, 99683 0, 99900 A 
8 - سس‎ DORE 92924 ; 
7 177 0, 23488 0, 60571 err ak WD 
A E aap T^ ca 0, 98836 0, 99585 4.00807 |. OE ten 
3 iad E rers , 0 
za 0 18312 0, 54670 0, 79104 a a er 
8 0, 00067 Somes : 0.98578 0, 99484 0,99832 E: 
100 : -|- 1 0, 89392 
=e 7 49348 0, 9 : 
9 0, 00025 an 0, 14289 MSN 0, 0,99384 0,99799 ser 0,99942 _ 
,920Í , LL وج مزع ا‎ m ㆍ 두 0 Q 
- = : 44566 0, 71825 : ۳ 
10 0,0008 | aes 0:11100 | an 0,445 < 책 0,999533 
„9488 „98029 | = TULTM ESSE DATA 
i 0004 0, 08726 0, 40277 0, 68424 nd 3 E 
i sis 0,9400 | _ “0,97717 0, 99190 GRA AA 
$ : | سس‎ 0, 835034 
- TI E 6 0,65215 a” 
12 OS CROCI cwm ed 0, 99089 0,99712 0, 99919 
,9307 ES y : 8160 
rei 0, 05355 0, 32997 9, 0060 88 ot ae 
PAD cuu FIE NONE 0,97015 0, 98983 0, 996 ; 
„9213 É 79779 
- 0,04204 ries be ed o 99663 às 0,99911 
14 0,0000 | sl 0: و‎ 0, 98871 0, í 
,912 , سس‎ 0, 78049 
15 0.00000 0, 03306 0, 27173 0, 56766 ida > 0,99907 
E i: 0, 90301 0, 96273 Fiat cu y 


i ۰۵ — OF 
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1 


6 


7 


8 


4 
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Tabelul 8, 


9 


1 (continuare) 


10 


~ i 
—————————————————————————— M MÀ—M — À—— M e 


16 0, 00000 0, 02605 0,24717 0, 54332 0, 76424 
0, 89444 0,95913 0, 98638 0, 99609 0,99903 
"T 0, 00000 0, 02057 0, 22526 0, 52081 0. 74912 
0, 88643 0, 95572 0, 98523 0, 99579 | -0,99897 
180 45 000000 0,01628 0,20574 0,50011 0, 73519 
0, 87908 0,95256 0,98411 0, 99547 0,99889 
19 0, 00000 0, 01292 0,18837 0,48118 | 0, 72252 
0, 87246 0,94968 0, 98305 0,99514 0,99881 
20 0, 00000 0,01029 0,17297 0, 46400 0,71115 
0, 86659 0,94711 0,98205 | 0, 99480 0,99871 
ZE 0, 00000 0, 00823 0, 15937 0, 44860 | 0,70114 ef m 
0,86150 0, 94483 0,98112 0, 99447 0,99861 
22 0, 00000 —| 0,00662 0,14743 0, 43499 ` 0, 69251 
0, 85715 0, 94282 0, 98027 0,99415 0, 99852 
23 | 0 —]| 0, 00535 0, 13706 0, 42323 0, 68527 = 
0, 85347 | 0, 94105 0, 97952 0, 99388 0, 99843 
24 0,00000 | 0, 00436 0, 12817 0, 41338 — | 0, 2 
0, 85033 : 0, 93954 0,97888 |... 0, 99364 | 0, 99835 
25 0, 00000 0, 00359 0, 12077 0,40546 | ㆍ | 0,67446. 5 
0, 84769 | 0, 93829 | 0,97836 0,99345 | 0, 99830 
26 | 0,00000 | | 9 0, 11487 ات :]39990 یل‎ EN 0, 67043. 
0, 84556 0, 93732 0,97797 0, 99331 0, 99825 
27 0,00000 | | 5 | 0,11054 (0,839446 | | 0,66723 
0, 84395 0, 93662 | 0, 97770 0, 99322 | 0, 99822 
28 | 0,00000| | 4 | 0,10746 0,39070 | | 1 EE 
0, 84286 0, 93617 | 0, 4 0, 99317 0, 99821 
* — i — 
29 0, 00000 0, 00206 0, 10519 0, 38815 0,66348 | 
0, 84224 0, 93594 0, 97746 0, 99314 0, 99820 
30 0, 00000 = 0, 00195 0, 10392 0, 38693 -. ft -0.00280_ UR 


0, 84202 


0, 93587 


Tabelul 8.2 


0, 99314 


Pragurile de semnificatie calculate pentru selecţii trunchiate (7 = volumul selecţiei, t, = punctul de censorizare/n, 
k|n = valoarea critică). 


n= 9 D 2 5 
pct. cens. EUR a | + A 3 
a sem AI DE EEE RER E SU SEE aer HUE SEMEN RT coc a A N SEE CNN eS ER 
| 
1 0, 40960 0, 94208 0, 99328 0, 99968 1, 00000 
2 0, 17280 z ~ 0, 80640 0, 98496 ~~ 0, 99968 1, 00000 
3 0, 07680 E O LOO. ^. 0,97472 0, 99968 . A OOO 
4 0, 03840 0, 69120 0, 96992 0499936 1, 00000 
5 0, 03840 0, 69120 zu 0, 96992 0,99936 1, 00000 
re pi oe se n O ti 
n= 10 
pet. k. 3% 2 3 4 5 
El Bo Al 7 8 9 10 
ARA AN EMT A > A اس‎ Sr مس‎ 
1 0, 38742 0, 92981 0, 98720 0,99836 0, 99985 
DE 0,99999 1,00000 1,00000 1,00000 1.00000 
2 0,15099 0, 74658 0,96170 | 0,99280 | 0, 99905 
ELA ss 0, 99991 0, 99999 1, 00000 | | 1,00000 1,00000 
3 0, 05930 | 0, 60283 0, 90626 0,98545 0, 99780 
ES | 0,99979 0, 99999 |  1,00000 1,00000 1:00000 
4 0,02351 0, 49185 0, 85126 0,97240 0,99668 
0,99971 0, 99999 1, 00000 1, 00000 1, 00000 
5 0, 00945 - 0,40609 | - 0,80419 0,95932- 0,99513 
SC HEN: 0,99971 0, 99999 1,00000 | 1,00000 1,00000 
6 0, 00387 0, 34054 0, 76748 0,94957 | 0, 99382 
0, 99961 0, 99999 1,00000 | 1,00000 1,00000 
7 0, 00163 ~ 10, 29215 | 0, 74300 0,94442 | — 0, 99279 
| | 0,99949 | 0, 99998 1, 00000 1.00000 1,00000 
8 0,00073 | 0,260344 | — ), 7331: 0 0410/2 ed 0,99230 
| 0,99944 0, 99998 1, 00000 | 1,00000 | 1, 00000 
9 0, 00036 0, 25128 0, 72946 0, 94101 0, 99222 
0, 99943 0, 99998 1, 00000 1, 00000 1, 00000 
10 0, 00036 0, 25128 " 0, 72946 0,94101 0, 99222 
0, 99943 0,99998 1, 00000 1,00000 1, 00000 


OFF 


Tabelul 8.2 (continuare) 


8 9 10 
1 0, 38064 ia 0,92622 | oo 0,98513 |. E 99775 ES 0,99974 | ps. 
2 | 0,14525 SENE 072970 | oe | O? 95460 Ere 98949 Er 0, 99807 ood 
3 0, 05559 o hondo A ET bro 0,99998 | * 지가 0,99999 a 0, 99999 
4 | 0,02134 pos i ERR ap 5 MN ERE مج‎ 
و‎ 0, 99699 ae 0, 99950 ia 0, 99994 ij iE 0, 99999 as 1, 00000 
6 | 0,0019 | ems V d dam ct C «ETC . — 7| Eom ~ o [usi 
7 | 0,00124 Bes 0,23477 S 1735 il © 87433 S sasha 0, 96724 es 
is 9.0040 0, 99212 ón 0, 99894 ی‎ 0,0 MOON 0, 99999 Nr | 0,99999 
^ TT e 770, 15546 nm 0, 55730 TTE 0, 83366 AE 0, 95382 es 
10 0, 00008 2 sd 0, 12843 Lom 0, 52639 <, 0, 81958 q! dd IES 
GENANNT. Les 0.10772 E oui 0, 50253 dM 0, 81028 os 0, 94728 = 
ae Gar PE o pole ziar ioo NE A cd AEST I nae | .9,99999 
13 | 0,00001 ERES 0, 08236 anaes 0, 48032 and 0, 80331 7 0, 94525 140. 
14 | 0 puces 00060 ون‎ 0, 47795 mah 0, 80275 Tu 0.04617 000 
Y^ ی‎ Qe 2 98882 2 0, 99837 Fide 0, 99983 ا 99999 ,0 یی‎ BA „00000 


TY 


n= 20 
pet. Km 2 
cens. 6 7 10 
1 0, 37735 0,92451 0, 98409 0, 99742 | 0, 99966 
0, 99996 0, 99999 0, 99999 _ 0, 99999 0, 99999 
2 0,14259 0,72170 0,95121 0,98774 0, 99747 
0, 99956 0, 99993 0, 99998 0, 99999 0, 99999 
3 0, 05396 0, 56360 0, 87602 0,97328 0,99302 
0,99847 0, 99971 0, 99995 0, 99999 0, 99999 
4 0, 02046 0, 44191 0, 79757 0, 94514 0, 98692 
0, 99668 0, 99929 0, 99987 0, 99997 0, 99999 
5 0,00777 0, 34749 0, 72480 0,91108 0, 97669 
0, 99436 0, 99867 0, 99974 Lo, 99995 0, 99999 
6 0, 00296 0, 27392 0, 65932 0, 87568 0, 96356 
0, 99095 0, 99794 0,99957 0, 99992 0, 99998 
7 0,00113 0,21645 0, 60093 0, 84120 0, 94903 io 
ted 3 0, 98657 0, 99697 0, 99930 0, 99989 0,99998 + 
8 0,00043 ` 0,17150 0, 54902 0, 80869 0, 93423 | 
5 0, 98164 0, 99579 0,99919 | 0,99986 0, 99997 
9 0, 00017 0,13630 0, 50295 0, 77866 | 0,91997 ; 
: : 0,97659 0, 99450 0,99896 __0,99984 0, 99997 
10 0, 00006 0, 10871 0, 46219 0, 75133 0, 90677 
0,97180 0, 99322 0, 99872 0, 99981 0, 99997 
11 0, 00002 0,08708 0, 42628 0, 72687 0, 89500 
0, 96754 0, 99207 0, 99850 0, 99975 0, 99997 
12 0, 00001 0,07012 0, 39484 0, 70540 0, 88494 
0, 96400 0,99112 | _ _|_ 99830 0, 99975 0, 99997 
13 0, 00000 0, 05683 - | 0,36762 0,68706 0,87680 
0, 96129 0, 99041 |__0,99814 0, 99972 0, 99996 
14 0, 00000 0, 04643 0, 34448 0, 67209 0, 87070 m 
0, 95940 0, 98990 0, 99802 0, 99969 0,99996 * 
15 0, 00000 0, 03836 0, 32542 | 0,66073 0, 86665 
0, 95820 0, 98955 0, 99794 0, 99968 0, 99996 
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16 0, 00000 | 0,03218 0, 31070 0, 65328 |" 0, 86434 
0. 98935 0, 99789 0, 99967 0,99996 
17 | 0.00000| ~ 0, 02761 NEEDLE ers | 0.64962 ^| 6,86299 | - a 
0,95705 0. 98926 ‘ 0, 99788 0, 99967 0, 99995 
18 | 0,00000 | 0,02460 | . - "| 0,29700 | 0,64772 0, 86245 > 
0, 95694 0, 98924 0,99787 0, 99967 0,99996 
19 0, 00000 | 0,02374 ^| 0,29553 | 0, 64728 0, 86237 
0, 95693 0, 98924 0,99787 0, 99967 0,99996 — 
20 | 00 0, 02374 0,29553 | 0, 64728 : 0, 86237 m 
0, 95693 0,98924 0,99787 0, 99967 0, 99996 
135 251 : 
pet. k=1 2 3 4 5 
cens. 6 7 8 9 10 
اه‎ eee et t O O SUE Iu A A su ne ire uci RENE aE ~”. 
1 0, 37541 0, 92351 0, 98347 0, 99721 0, 99962 
0, 99995 0, 99999 0,99999 0,99999 0,99999 
TUS 6 pagi 우 0,71703 = 0, 94923 0, 98667 0, 99707 
0, 99945 0, 99991 0, 99998 0, 99999 0, 99999 
3 | 0,05305 : 0, 55663 0, 87036 0 97082 0,99184 
0, 99804 0, 99959 0,9999 0, 99998 0, 99999 
EA 7 | . E 0, 43362 0, 78799 0,93971 0, 98455 
0, 99566 0, 99894 0, 99977 0, 99995 0,99998. 
5 | 0,007553 | 0, 33853 0, 71153 0,90175 0,97218 ^ 
0, 99247 0, 99795 0,99951 0, 99989 0,99997 
6 0,00284 X 0, 26473 0, 64263 0, 86193 0, 95600 
| 0,98766 0, 99668 0,99915 0, 99981 0,99996 — 
7 0, 00107 | 30,20731 0, 58104 0, 82269 0, 93769 
| 0, 98129 0, 99492 0, 99870 0, 99969 0,99993 
8 | 0,00041. E d6250 “0, 52609 0, 78513 0, 91849 
| 0,97379 0,99265 0, 99813 0, 99956 0, 99990 
9 0,00015 0,12772 0, 47706 0, 74974 0,89924 
ee f |. 0,96565 0, 98997 0, 99743 0, 99941 0.99987 
10 0, 00006 " 0,10050 0,43333 0, 71669 0,88051 | 
use. EDO A 0, 98702 0, 99662 0, 99923 0.99984 
11 0, 00002 0,07925 0, 39432 0, 68602 0,86265 
GINO O 0, 9838 0, 99574 0, 99904 0, 99981 
12 0, 00001 0, 06263 0, 35956 0, 65770 0, 84590 
os 0,94111 0, 98100 0, 99486 0, 99884 0,99978 
13 0, 00000 0, 04962 0, 32861 0, 63172 0, 83043 
| 0.93379 0,97822 0, 99402 0, 99864 0, 99974 
14 0, 00000 0, 03944 0,30112 - | 0,60803 "| 0, 81638 X 
V 0,92720 0,97574 0,99327 0, 99846 0,99971 
15 0, 00000 0, 03146 0,27676 0, 58663 à 0, 80386 hos 
CORSA AUS E 0, 97362 0, 99264 0, 99831 0.99968 
16 0, 00000 0, 02520 0, 25529 | 0,56753 0, 79298 ih 
D 0, 91666 0,97191 0,99214 0, 99818 0, 99965 
17 0, 00000 0,02029 | | + 8 s 0.55078 | ERTS E 
=e | 0,91285.- 0, 97082 0, 99176 0, 99808 0,99963 
18 | 0,00000 0, 01644 0,22019 0,536051 | . | 0,776049 
0, 91001 0, 96969 0,99148 0, 99800 0,99961 
19 0. 00000 0, 01344 0, 20633 0,52484 | . | 0,77105 
PEU UE 0, 90809 0, 96907 0,99129 0,99795 0,99960 
20 | 0,00000 0,01110 0,19492 0, 51600 0, 76745 
0, 90688 0, 96866 0,99117 0,99793 0, 99959 
21 0, 00000 0, 0093 0, 18611 0, 51020 0, 76541 
zh | 0,90613 0,96843 | _ 0,99111 0, 99791 0, 99959 
22 0, 00000 0, 00799 0, 18024 0, 50736 0, 76422 AO 
0, 90576 0, 96834 0, 99109 0, 99791 0, 99959 
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0, 76374 


0, 00000 0,00712 

0, 90565 0,96832 0, 99109 0, 99791 0, 99959 

24 0, 00000 0, 00687 0,17702 0, 50553 0, 76367 
0, 90564 0, 96832 0, 99109 0, 99791 0, 99959 

25 0, 00000 0, 00687 A 0,50553 0,76367 
0,90564 | 0, 96832 0, 99109 0, 99791 0, 99959 

1 0,37413 0,92285 0,98306 0, 99707 0, 99958 
0,99994 0,99999 0,99999 0,99999 0, 99999 

2 0, 14006 0, 71396 0,94793 0,98595 0,99679 
0, 99937 0,99989 0,99998 0, 99999 0, 99999 

3 0, 05246 0, 55212 0, 86665 0,96920 0, 99103 
0, 99773 0, 99949 0,99989 0, 99997 0, 99999 

4 0, 01967 0, 42833 0, 78179 0, 93612 0, 98293 
| 0, 99492 0, 99867 0, 99969 0, 99993 0, 99998 

q 조스 — — — رس سس‎ Ss x 

5 0, 00738 0, 33292 0, 70306 0, 89564 0, 96911 
0,99111 0, 99738 0, 99931 0, 99983 0, 99996 

6 0, 00277 | 0,25908 0, 63217 0, 85305 0, 95090 
0, 98530 0, 99567 0, 99876 0, 99968 0, 99992 

7 0,00104 0, 20182 0, 56881 0, 81091 0, 93010 

» 97730 0, 99806 0, 99987 . 


| 0, 99328 


Q, 99947 


۳ = 30 
pet. k=1 2 3 4 5 
8 0, 00039 0, 15736 0, 51229 0, 77040 0, 90807 
0, 96817 0,99013 | - 0,99713 0, 99920 0, 99979 
9 0, 00015 0,12282 0, 46185 0, 73201 0, 88570 
0,95782 34 0, 98628 0, 99594 0,99888 0, 99971 
10 0, 00006 0, 09596 0, 41682 0, 69589 0, 86359 
0, 94691 0, 98191 0, 99450 0, 99847 0, 99960 
11 0, 00002 0,07506 0,37660 0, 66208 0, 84209 
0, 93579 0, 97720 0, 99286 0, 99800 0, 99949 
12 0, 00001 0, 05879 0, 34067 0, 63050 0, 82145 
0, 92475 0,97232 0, 99109 0, 99747 0, 99936 
13 0, 00000 0,04611 0, 30857 0, 60107 0, 80180 
0, 91399 0, 96743 0, 98925 0, 99690 0,99921 
14 0, 00000 0, 03622 0, 27990 0,57371 0, 78324 
0, 90369 0, 96266 0, 98741. 0, 99632 0, 99906 
15 0, 00000 0,02850 0,25429 0, 54833 0, 76584 
0, 89397 0, 95813 0, 98565 0, 99575 0, 99891 
16 0, 00000 0, 02247 0,23143 0, 52485 0, 74965 
6, 88494 0, 95392 . 0,98401 0,99522 0,99877 
17 0, 00000 0, 01776 0,21104 0, 50321 0, 73470 
0, 87667 0, 95010 0, 98253 0, 99474 0, 99865 
18 0, 00000 0, 01407 0,19289 | ㆍ 0, 48336 0, 72103 
0, 86923 0, 94673 0, 98125 0,99433 0, 99853 
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Deoarece versiunea trunchiată a statisticii Kolmogorov-Smirnov 
(3.2) este invariantá sub transformarea integrală probabilistá, nu 
avem nici o restringere a generalitátii presupunind că (aw) = a, 
0 < 2 <1. În cele ce urmează F,(T) va fi identificat cu T. În acest 
mod statistica Kolmogorov-Smirnov devine 


(8.3) Dy;r = sup |Fy(x)— zl. 


0<x<T 


Brownian {Z(-)} pe (0,1), pare rezonabil ca 


lim P(/ NDy , < d) = P((D, < d), 


N-oo 


(3.4) 


"nde 
D, = sup |Z(2)|. 
0<xr<T 
Anderson, Darling (1952) aratá cá 


Gold) = P( 14 s 40) = 


مساو 
x P(X — 2(0])1 = ۲(/ ۳۶| —(T — T°),‏ 
unde X ~ N(0,1).‏ 
Observaţie. Pentru argument fixat, Gr este crescătoare în 7;‏ 
limita cînd T — 1 este G,, funcția de repartiție asimptotică a sta-‏ 
c . [T 3 . Í ..‏ مو ee‏ ۰ 
iisticii Kolmogorov-Smirnov | N Dy; 1 netrunchiatá. Deoarece termenii‏ 


( — LYexp( — 25242) x 


i 
ré 
C 
~ 


> | seriei (8.5) alternează in semn si descrese exponential, poate fi obti- 


nutà rapid convergenta evaluind cîţiva termeni centrali şi poate fi 
determinată o margine superioară a erorii facute prin aproximarea, 
lui (8.5) de o sumă finită. Observind că termenii corespunzători lui 
+ j sint egali obţinem o simplificare a calculelor. 

Cu ajutorul unei scheme iterative, pentru timpii de trunchiere 
T = 0,1(0,1)0,9 si pentru probabilitățile cumulate 1 — « sint deter- 
minate valorile critice Gz!(1 — d). Aceste valori sint prezentate in 
tabelul 8.3 si pentru comparaţie sint date valorile critice asimptotice 
ale statisticii Kolmogorov-Smirnov pentru întreaga selecție. 


8.2. Generalizări. Date censorizate; Problema celor două selecții 


Presupunem că .Y,, X, ..., Xy este o selecţie asupra unei 
variabile repartizate uniform pe (0,1) însă că observaţiile sint cen- 
sorizate, adică observaţiile sint 


vr 7? re 
Ap Aa, ..., XN, 
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Astfel din tabelul 8.3 pot fi obţinute probabilitățile limită ale 
statisticii Kolmogorov-Smirnov trunchiate pentru două selecţii. 

După Barr, Davidson (1973), trunchierea interioară este echi- 
valentă probabilistic cu trunchierea superioară; deci tabelul 8.3 
poate fi folosit cu date trunchiate la stinga sau cu date censorizate 
în cazul unei selecţii sau în cazul a două selecţii. 

Poate fi definită o statistică Kolmogorov-Smirnov pentru date 
trunchiate dublu (la cen si la stinga) ca in (8.6), cu exceptia 
faptului că sup va fi luat pe domeniul corespunzător. 

Repartiția asimptotică a statisticii test corespunzătoare poate 
fi obtinutá printr-o metodă similară cu cea prezentată in $ 8.1. 

Exemplul 8.1 (Koziol, Byan (1975)). Presupunem că dorim sá 
verificăm ipoteza conform căreia durata de funcționare a unei anu- 
mite márei de becuri electrice este repartizată exponential cu media 
500 ore. 50 de becuri au fost puse să funcţioneze simultan ; becurile 
care au ars nefiind înlocuite. Experimentul s-a terminat in 300 de 
ore ; a fost găsit că | N 72717 1,91 si timpul de trunchiere transfor- 
mat a fost 


1 — exp(—300/500) = 0,4512 


Deoarece punctul de 99,9% pentru T = 0,5 este 1,8828, avem o 
evidenţă puternică fata de ipoteza nulă. 

Exemplul 8.2. O experienţă clinică are drept scop compararea 
eficacitátil a două tratamente (placebo si estrogen) pentiu cancerul 
de prostată. La sfirsitul a 5 ani, 52 din 223 pacienţi ce au, primit 
tratamentul eu placebo si 52 din 211 pacienţi ce au primit tratamentul 
cu estrogen, mai sînt îneă în viaţă. Comparind cele două curbe de 
supravieţuire, s-a găsit 


Du, .بر‎ ۰ = 0,059 
81 statistica amară Ê aihn pentru două selecţii are valoarea 


[MANJCM - 2Da nr — (10,412)(0,059) — 0,614. 


Cel mai mic f/N din cele două selecţii este 1 — (52/211) = 0,754; 
deci comparind 0,614 eu valoarea critică pentru 7 = 0,8, tragem 
concluzia că cele două tratamente nu diferă semnificativ pe perioada 
de 5 ani ور‎ ae 

Exemplul 8.3 (Barr, Davidson (1973)). Se pun in functie n = 20 
articole si fiecare fr folosit 2,2 ore sau pină se detectează. Ne Opes 
la realizarea primului dintre aceste două evenimente (produsele care 
s-au detectat nu sint înlocuite prin produse bune). 

Ne propunem să verificăm ipoteza conform căreia timpul de 
detectare este o variabilă exponential’ eu parametru 0,10 (media 
timpului de defectare 10 ore). Presupunem că au fost observate 7 
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defecte la momentele 0,1; 0,2; 0,3; 0,4; 0,7; 1,0 si 1,4 ore. În con- 
trast cu selecţia censorizată, în acest caz trebuie să aplicăm transfor- 
marea probabilistă integrală punctului de trunchiere 7, ; fie T, ima- 
ginea sa pe (0,1). Cu na ich 0,10 specificat de ipoteza nulă, 
timpul de trunchiere T, se trai isformá în punctul T, = 1 — 
exp[ —(0,10)(2,2) ]— 0,20. Folosind interpolarea în tabelul 8.2 cu 44— 20 
si punctul de trunchiere 4/20, valoarea, critică la pragul 0,05 este 
aproximativ 0,20. Valoarea observată a lui To depășește această 


valoare, deoarece avem salturi ale lui 7, deasupra marginei supe- 


rioare a bandei de acceptare (dreapta y = x + 0,20). Regiunea de 
încredere pentru funcţia de repartiție bazată pe selecția trunchiată 


2 


(dupá transformarea la (0,1)) are forma din fig. 5.3. 


9. Testul Kolmogorov multidimensional 


Saunders, Laud (1980) prezintă un test de concordanţă pentru 
repartitii multidimensionale, test care este o extensie a testului Kol- 
mogorov pentru repartitii uni-dimensionale. 

Presupunem că: 

i) Folli, ..., m) este o functie de repartiție m-dimensionalá con” 
centrată pe Lala. Ca 0 a, اک‎ 

ii) în raport cu o măsură Lebesgue m-dimensionala PF, are densi- 
tatea fo(%, .... Em) care este strict pozitivă în interiorul lui I, si 
zero in rest. 

Pentru 0 > p < considerăm mulțimea submultimilor lui Im 
definite di "vg =(4:Pox) > pj. Notăm că, fiecare multin 16 A, este 
măsurabilă si că Po(4,) este o functie strict crescătoare de p. Astfel 
pentru fiecare p in [0,1] există o valoare unică «(p) in [0,1] astfel că 


Po(Aap) = p si definim B, = Aq. 
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„Regiunile {A,:0 > p > 1} si (B,:0 > p < 1) sint unic deter- 
minate de ۰ 
as A . sae sw 더 a y Y^ 
Fie P, funcţia de repartiție empirică a unei selecţii X,,..., ۳ e 
asupra unui vector m-dimensional avînd funcţia de repartiție Y 
care este de asemenea concentrată în Im. 
Testul pentru verificarea ipotezei 


Ho: F= F, față de H,: F # P,, 


care este analogul testului Kolmogorov clasic, respinge ipoteza H, 
pentru valori mari ale statisticii 
Da = sup |#,(B,) — Fy(B,)|. 
O<p<l 

Dy; are, in ipoteza nulă, aceeaşi repartiție pentru toţi m>1 si D} 
este statistica Kolmogorov. Astfel tabelele standard şi aproximatiile 
asimptotice pot fi folosite pentru găsirea cuantilelor statisticii ۰ 

Acest test nu este consistent fata de toate alternativele deoarece 
există repartitii F, + F, care satisfac 


F,(A,) = F,(A,) pentru toate A, = {æ : Fs(x) > p}. 


Totuși dacă ne restringem atenţia la alternative care au densități 
pozitive, testul este consistent. 


10. Testul lui Massey 


Massey ((1950), (1951)) propune pentru verificarea normalitatii 
pentru selecţii de volum mic (10 < n < 30) un test care urmează in 
linii mari procedura indicată de testul Kolmogorov-Smirnóv. 

Fie X,, X2,..., X, o selecţie asupra unei variabile aleatoare X. 

Ne propunem să verificăm ipoteza 


Hy: X بح‎ N(p, 02). 
Se considera statisticile de ordine 
Va, X Lay > ۰۰۰ < Lip) 


şi se calculează funcţia de repartiție empirică F,(%). 

Se standardizează variabilele va în felul următor : 
que E 1 p 
e 6 me, 

S n 


۳ 
9) T 
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si se calculează 


Yd) 


1 72 
D(Ya) = Ta | exp — a] dt. 
AT a 


—00 
Se calculează diferenţele 
0, = | 1) (ن‎ M (y) | 
și se alege 


(nsi — MARA 
l«i«n 


Se respinge ipoteza H, daca 
hax > Atabelat- 


Valorile critice pentru testul lui Massey sint date în tabelul 10.1 
(Kowalski (1970)). 


Tabelul 10.1 


Valorile critice pentru testul lui Massay 


a a 

그 St) A AME oe 11 A 

0,05 0,10 0,05 0,10 
8 0,140 | 0,163 | 20 0,117 | 0,133 
9 0,134 | 0,158 | 21 0,115 | 0,131 
10 0,130 | 0,156 | 22 0,113 | 0,129 
11 0,129 | 0,155 | 23 0,112 | 0,128 
12 0,128 | 0,154 | 24 0,110 | 0,126 
13 | 0,128 0,153 25 | 0,109 0,124 
tår  0.328 0,151 26 ۱ 0,108 | 0,121 
15 | 0,127 | 0,148 | 27 | 0,107 | 0,120 
16 | 0,126 | 0,144 | 28 0,105 | 0,118 
127. 20:424 10:0,142 | 198 1^1 02041. 10 
18 | 0,122 | 0,138 | 30 | 0,102 | 0,114 
19. 019071 (0,136 1.2321, 0:099. | 507111 


Exemplul 10.1 (Voda (1972)). La titrarea tetrafenilboratului 
(Ceauşescu, D(1971)) s-au obţinut următoarele date (ml reactiv) : 
10,83 و 10,85 و 10,85 ;10,84 و‎ 10,86; 10,86; 10,86; 10,87; 10,87; 10,87; 
10,87 و 10,88 و 10,88 و 10,88 ;10,88 و‎ 10,88; 10,88; 10,89; 10,89; 10,89; 
10,89; 10,89; 10,90; 10,90; 10,90; 10,91; 10,91; 10,92. 

Avem 2 = 10,88 si s = 0,01. Tabelul 10.2 arată modul de lucru cu 
testul lui Massey. 
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Tabelul 10.2 


Valorile | xy — =| aoa لا و‎ 
observate|Frecvenfa|y(s) = | Ce ore pes i ezepi ds 
x. " empiricá teoretică 
(6) | Fa(y | Puw) 
| | | | 
10,83 | 1 —5, 000 0,035 | 0,0000003 | 0,034 
10,84 | 1 —4A, 000 1 05071 0,0000317. | 0,070 
10, 85 2 — 3, 000 | 0,142 | 0,0723499 | 0,070 
10,86 3 | —2, 000 1:30,250. 1 030227501 | 0,927 
10, 87 4 —41, 000 0,392 0,1586550 | 0,233 
10,88 6 0 0,571 0,5000000 | 0,071 
10,89 5 1,000 0,750 0,8413450 | 0,091 
10,90 3 2, 000 0,812 | 0,9772499 | 0,085 
10,91 | 2 3, 000 0,964 0,9286501 | 5 
10,92 | 1 4,000 ۱ 0,9999683 | 0,001 


Avem dai, = 0,233 si din tabelul 10.1, rezultă do, os; ور‎ = 0,105; nu 
putem spune că repartiţia este normală. 

Exemplul 10.2 (Drăgan, Enache (1980)). În vederea studierii 
caracteristicilor statistice ale amplitudinii supratensiunilor de comu- 
tatie care apar pe liniile electrice aeriene in tara noastră, s-au efectuat 
încercări experimentale în sistemul electro-energetie. S-au înregistrat 
supratensiunile de comutație fazá-pámint care apar la închiderea, 
în gol a unei linii electrice aeriene de înaltă tensiune de 400 kV $i 
cu o lungime de 74 km, înregistrările efectuindu-se la capătul rămas 
neconectat al acesteia. Rezultatele obţinute sint prezentate în 
tabelul 10.3. 


Tabelul 10.3 


XQ) 1,15 | 1,16 | 1,19 | 1,19 | 1,21 | 1,21 | 1,23 | 1,25 | 1,26 | 1,27 
i | 1 DIVA 4 | 5 6 7 | 8 pd 10 
aq) E 27 | 1,29 | 1,29 | 1,29 | 1,37 | 1,38 | 1,38 | 1,39 | 1,50 | 1,51 
i lala | 9 14 | 15 | 16 | 17 | 18 | 19 | 20 


unde مه‎ sînt date în valori relative în raport cu tensiunea maximă 
pe fază. 

Avem aq —1,289,s—0,102, dmax=0,196 şi din tabelul 10.1 : do,os; 20= 
—0,117 ; do, 01; 20 = 1,33, ceea ce ne permite să acceptăm, atît la pragul 
de semnificatie « = 0,05, cit si la pragul de semnificaţie « = 0,01, 
ipoteză conform căreia repartiţia amplitudinii supratensiunilor de 
comutație este normală. 
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11. Programe şi subprograme FORTRAN privind testele 
de tip Kolmogorov-Smirnov 


1. Pentru a calcula valoarea S,,(#) (1.1) este necesar de a pune 
în ordine elementele vectorului X. De aceea, în continuare, vom 
prezenta unul din cei mai simpli algoritmi de sortare (punere în ordine) 
sub forma unui subprogram pe care l-.m numit SORT şi a cărui 
schemă logică este dată în fig. 5.4. 


(RETURN) 


RETURN 


Fig. 5.4 


| SUBROUTINE SORT (X, N) 
DIMENSION X(N) 

| IF (N.LE.S1 RETURN 
DU. Y ۸ که‎ ZN 
We 
J=I—1 
IF(X(J).LE.Y) GO TO 1 
X(J +1) = X(J) 
J = J = 1 
IF (J.GT.O) GO TO 2 
X(J +1) = Y 
RETURN 

| END 


unde : 
X — vectorul ce contine elementele de pus in ordine (real) 
N — numărul elementelor lui X (întreg) 


IIL FETS 


Observaţie. În cazul în care elementele ce se sortează sînt de tip‏ داب 
ntreg instrucțiunea a doua se înlocuieste eu:‏ 


|] INTEGER X(N). 
2. Calculul valorii functiei empirice de repartitie in punctul 


X1 (1.1) se poate face cu ajutorul subprogr i ărui ă 
me jut amul i 
logicá este datá in fig. 5.5. R Uv paper mia. 


Fig. 5.5 
FUNCTION SN (X, N, X1) 
DIMENSION X(N) 
IS =) 


TUI J = (LS + LDy2 

IF (LS.GT.L.D) GOTO 5 

IP (X(J) — X1) 455,6 

alo Yol 

GO TO 7 

41| I8—J41 

| .@0 TO 7 

5 || SN = FLOAT (J) | FLOAT (N) 
|| RETURN 

END 
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unde : 
X — vector al statisticilor de ordine (real) 
N — dimensiunea vectorului X (întreg) 
X1 — punct de comparaţie al funcţiilor de repartiție empirice 
şi teoretice (real). 

3. Ca o aplicaţie a celor două subprograme precedente SORT 
şi SN vom prezenta un program în care se calculează valoarea funcţiei 
empirice de repartiție pentru un număr necunoscut de valori si se 
desenează la imprimantă graficul obţinut. 


DIMENSION LINIE (132), X (100) 
DATA-IB, LINIE, 197/1330 '. 4 cus Les! 
READ(105,1)N, (XAU), I = 1,N) 
FORMAT (13/(10F8.4)) 

CALL SORT(X, N) 

READ(105,2, END — 3) X1 

FORMA T(F10.4) 

K1 = 131.*8N(X,N,X1) + 1 
LINIE(K1) = IST 

WRITE(108,4) LINIE 

FORMAT(. .', 13241) 

LINIE(K1) = IB 

GO TO 5 

STOP 

END 


HE 


۱۵ a 


N 


e 


Pe prima cartel de date se dă valoarea lui N(coloanele 1— 3), 
iar pe cartelele următoare se dau cele N valori ale vectorului sta- 
tisticilor de ordine, cîte zece pe o cartelă (ultima poate fi incompletă) 
fiecare valoare dindu-se în cite 8 coloane din care ultimile 4 sînt zeci- 
male. În continuare se dau punctele pentru care se calculează va- 
loarea funcţiei, cîte unul pe fiecare cartelă perforat în coloanele 1—10 
din care coloanele 7—10 reprezintă partea zecimală. 

La imprimantă va apare o stelutá tipărită la o distanţă de prima 
coloană direct proporţională cu valoarea calculată a funcţiei. 

Observaţii. 1) Imprimanta trebuie să fie rotita cu 90° în sens 
invers acelor de ceasornic pentru a avea pe verticală valoarea funcţiei. 

2) Dacă valorile vectorului X sînt deja în ordine, a cincia in- 
structiune (si deci şi subprogramul SORT) pot să lipsească. 

4. Statisticile Kolmogorov-Smirnov pot fi calculate după for- 
mulele (2.3—2.4) presupunind dat pentru funcţia de repartiție un 
subprogram funcţie FX de parametru X. Subprogramul ce calculează 
statisticile DF, Dz si D, l-am numit SD, iar schema lui logică este dată 
în fig. 5.6. 
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SUBROUTINE SD(X, N, DP, 
DM,D) 

DIMENSION X(N) 

R = 1./PLOA T(N) 

: 

DM =Ø. 

DP= g. 

DOLI =1,N 

Z = FX(X(L) 

IF(Z — Y.GT.DM) DM =Z — Y 
Yo. 14 E 
IF(Y-Z.GT.DP)DP=Y - 
CONTINUE 

D= DM 

IF(DP.GT.DM) D = DP 
RETURN 

END 


X  — vector al statisticilor de 
ordine (real) 
N  — dimensiunea vectorului X 
(întreg) 
DP — valoarea calculată pentru 
D; (real) 
n 
Fig. 5.6 DM — valoarea calculată pentru 
D (real) 
D — valoarea calculată pentru D (real) 
Am presupus că elementele vectorului X sint in ordine erescá- 
toare. Funcţia FX se poate da fie sub forma unei instrucţiuni funcție 
ce se plasează în subprogram după a doua instrucţiune, fie ca un 
subprogram (funcţie) separat. În unele cazuri se poate înlocui 
instrucţiunea a 8-a cu succesiunea de instrucţiuni prin care se calcu- 
lează valoarea funcţiei F(z). 
5. Limitele pentru banda de încredere pot fi calculate după for- 
mulele (3.4—3.5) cu subprogramul pe care l-am numit LIM. 


SUBROUTINE LIM(DNALFA, S,XLN,XUN) 
XIN = 8 = DNALFA 

IF(XLN.LT.O.) XLN = 0. 

XUN = ۸ + DNALFA 

| 


IF(XUN.GT.1.) XUN = 1. 
RETURN 
END 


unde : 
DNALFA — contine valoarea tabelará DD, (real) 
S — conţine valoarea lui S,(X) (real) 
XIN — conţine valoarea calculată pentru L,(x) (real) 
XUN — conţine valoarea calculată pentru U,(z) (real) 


6. Tinind seama de subprogramele SORT şi S.N de la punctele 1 
şi 2 şi de programul de la punctul 3 se poate scrie un program pentru 
a desena graficul funcţiei S,(w) împreună cu banda de încredere. 


DIMENSION LINIE(132),X(190) 


DATA IB, LINIB,IST,IS/133 OUR 


READ(105,) N,DNALFA,(X(I),I —1,N) 
FORM AT(I3,F10.6/(10F8.4)) 
CALL SORT(X,N) 
READ(105,6, EN D = 7) X1 
FORMA T(FAQ.4) 

S = SN(X,N,X1) 

CALL LIM(SNALFA,S,XLN,X UN) 
LIN = 131.*XLN +1 

LUN = 131.*XUN +1 
LINIE(LLN) = 8 
LINIE(LUN) = 18 

WRI TE(108,2) LINIE 
FORMAT('._”,18241) 
LINIE(LLN) = IB 
LINIE(LUN) — IB 
L=181.* 8 +1 

LINIE(L) = IST 
WRITE(108,2) LINIE 
FORMAT(?+?,132.A1) 
LINIE(L) = IB 

GO TO 5 

STOP 

END 


Datele se prezintá la fel ca cele de la programul de la punctul 3 
in afară de prima cartelá unde apare în plus în coloanele 3—13 (ulti- 
mele 6 sînt zecimale) valoarea lui Dy ce se ia din tabele. În plus fata 
de rezultatele de la punctul 3 apar la imprimantă linii ce reprezintă 
cele două limite. Observațiile de la punctul 3 rămîn valabile si in 
acest caz. 

7. Tabelele cu care se lucrează în statistică pot fi memorate pe 
disc uri sau benzi şi în momentul căutării în ele pot fi duse în memoria 
calculatorului total sau parţial 81 să se tacă o căutare automată în 


pl 


O ۲ 


bo 


w 


-1 
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f ele. Un exemplu de căutare în tabel este subprogramul funcţiei 


DNALFA care caută valoarea D,,. Schema lui logică este dată în 
figura. 5.7. 


(START 


RETURN 


| Fig. 5.7 


FUNCTION DNALFA(N,ALFA,DNA,N1,N2,N3,ALPA1) 
DIMENSION ALFA1(N1),N3(N2),DN A(3,N2) 
DOLE سب‎ W1 
IF(ALFA1(I).EQ. ALFA) GO TO و‎ 
1 CONTINUE 
WRITE(108,3) ALFA 
3 FORMA T'O_ALPA=",P1.04/_NU ESTE IN TABEL’) 
RETURN 
2 DO 4 J —1,N2 
| IF(N3(J).EQ.N) GO TO 5 
CONTINUE 
WRITE (108,6) N 
6 FORMAT (iN —',I5,'NU ESTE IN TABEL’) 
RETURN 
5 DNALFA = DNA (1,J) 
RETURN 
END 


unde : 
N — este primul parametru din D,,,(intreg) 


ALFA — PUT E de semnificaţie cu care se lucrează 
Tea 
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DNA — matrice care contine valorile D,,. tabelate (real) 

N3 — vector ce conţine valorile posibile ale lui N (întreg) 

ALFA1— vector ee conţine valorile posible pentru 고고 
real 

N2 — gee vectorului V8 si numărul de coloane 
din DNA (întreg) 

N1 — dimensiunea vectorului ALF A1 si numá1ul de linii 


din DNA (întreg cu valoarea în intervalul [1,8]) 

În programul ce folosește subprogramul DNALFA trebuiesc 
dimensionate şi citite de pe cartele, disc sau bandă tablourile ALFA1, 
N3 şi DNA (în programul principal DNA trebuie să aibă tot 3 linii 
chiar dacă .N1 > 3) ca şi valorile variabilelor N1 si N2. Dacă la 
chemarea subprogramului DN ALFA printr-o instrucţiune de forma : 


| | DNAL = DNALFA(N,ALFA,DNA,N1,N2,N3,ALFA1) 


apare la imprimantă unul din mesajele : 

AFLA = .... NU ESTE IN TABEL 
sau 

N=... NU ESTE IN TABEL 
rezultatul obţinut in continuare in program este eronat şi nu trebuie 
luat în consideraţie deoarece valoarea lui DNAL nu este cea cores- 
punzătoare lui Dau (nu a fost găsită in tabel). 
A POS Presupunind dată funcţia F(x, 
0ı, 02) sub forma de subprogram fun- 
etie sau formulă, statistica D, din for- 
mula (6.1) poate fi calculată cu sub- 
programul funcție DNK a cărui 
schemă logică este dată în fig. 5.8. 
Deoarece S,(z) este o funcție constantă الم‎ 
pe intervale, iar F, este o funcţie cres- 
cătoare (fiind funcţie de repartiție) 
rezultă că maximul modulului din for- 
mulă este atins în unul din capetele 
intervalelor pe care S,(w) este con- 
stanta. 


Fiz FO(X(1), 84,82) 


F2=|S-FIl 


<> DNK-F2 


y 


FUNCTION DNK(X, N, 
이 TETA1, TETA2) 

DIMENSION X(N) 

8 = Ø. 

R =1./FLOAT(N) 

DNK = Ø. 

20111. M 


ㅣ 
i 
1 
l 
1 
ㅣ 
l 
i 
i 
1 
1 
mud i 
i 
1 
ㅣ 
1 
| 
1 
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voe EAS vt oi EE 
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F1= FI ((X(1)-X1)/$) 
F2=[S1-F1l 


RETURN 


Fl = PO(XU), TET A1,TETA2) 
F2 = ABS(S — F1) 

IF (DNK.LT.F2) DNK — F2 
S=S+R 

F2 = ABS (6 — F1) à) 
IF (DNK.LT.F2) DNK — F2 


CONTINUE 
RETURN 
END 
unde: 
X — vector ce contine va- 
lorile de comparaţie 
(real) 
N — dimensiunea  vecto- 


rului X (întreg) 
TETA1 — contine. valoarea lui 
6, (real) 
TETA2 — contine valoarea lui 
R " 0, (real) 
0, şi 0, sint estimatiile parametrilor 
necunoscuţi, iar funcţia FO este fun- 
etia de repartiție specificată de ipoteza, 
nulă. Valoarea obţinută din subpro- 
gramul funcţie se compară cu cea ta- 
belată pentru a accepta sau respinge 
ipoteza. 

9. Statisticii Lilliefors dată de for- 
mula (6.2) îi corespunde subprogramul 
funcţie DNL a cărui schemă logică este 
dată în fig. 5.9. 


FUNCTION DNL(X,N) 


و 


DIMENSION X(N) 
S =9. 

R = 1. [FLOA T(N) 
DNL =Ø. 
ELO, 
DO1I=1,N 


1 X1 = X1 + X(1) 

X1 = X1/FLOAT(N) 

DO2 7 =1,N 
2|| S=8 +(X1)-XD**2 

S = SQRT(SIFLOAT (N—1)) 
Fig. 5.9 81 = 


10 3 7 -- 1, ۷ 

F1 = FI((X(I) — X1)/8) 

F2 = ABS(S1 — F1) 

IF(DNL.LT.F2) DNL — F2 

S1= $1 + R 

F2 = ABS(S1 — F1) 

IF(DNL.LT.F2) DNL — F2 
3 CONTINUE 

RETURN 

END 


unde : nh 

X — vector al statisticilor de ordine (real) 

N — dimensiunea, vectorului X (întreg) = : ; 
În subprogram se foloseşte subprogramul funcţie FI din capito- 

lul 1 pentru calculul valorii funcţiei lui 

Lagrange deoarece avem egalitatea : 


F*(a) ipsis 


8 


Am presupus că valorile ce apar în vecto- 
rul X sînt în ordine crescătoare. Valoarea, r 
obţinută pentru Di prin apelarea sub- | 
programului funcţie DNL se compară | 
cu valoarea critică din tabelă pentru a 
accepta sau respinge ipoteza. 

10. Pentru cazul cînd 'P*(2) este 
funcţia de repartiție a variabilei expo- ۲ 
nentiale cu 1/4 = 2, deci: 


Fizice XX 


F*(x) = ti BOD 1 > 0 

1 — e-*/* pentru >0 
selecţia de volum se determină din for- 
mula (6.3). Pentru aceasta am scris sub- 


programul funcție DNE a cărui schemă 
logică este dată in fig. 5.10. | 
[ FUNCTION DNE(X,N) | 
DIMENSION X(N) j 
R — 1./FLOAT( N) | 
S= 9. ۱ 
DNE - 0. an 
E Gl 0 : 
DO ta LN Fig. 5.10 
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1 Al = X1 + X(I) 

X1 = X1/FLOAT(N) 

DO 2-1 STIN 

iy 

IP(X.GT.9.) F1 = 1 — EXP(—X(1)X1) 
F2 = ABS(S — F1) 
IF(DNE.LT.F2) DNE = F2 
S=S+R 

F2 = ABS(S — Fl) 
IF(DNE.LT.F2) DNE = F2 
2 CONTINUE 

RETURN 

END 


unde : 
X — vector al statisticilor de ordine (real) 
N — dimensiunea vectorului X (intreg) 

Am presupus că valorile ce apar în vectorul X sînt în ordine 
crescătoare. Valoarea obținută pentru DN E se compară cu cea tabe- 
lată pentru a accepta sau respinge ipoteza. 

11. Pentru statistica lui Srinivasan dată de formula (6.7) în 
care Bla; A) este dat de formula 


~ a n—1 
Ple y = v= (0 ecl 
NL 


am seris subprogramul DNS. 


FUNCTION DNS(X,N) 
DIMENSION X(N) 
R=1./FLOAT(N) 
S — $6. 
DNS = 0. 
31.5. 
DO 17 =1,N 

1 Au ss PES) 
X1 = X1/FLOAT(N) 
DO21=1,N 
Fi =1. — (1 — X(I)(N«X1))e«(N — 1) 
F2 = ABS(S — F1) l 
IF(DNS.LT.F2) DNS = F2 
S=S+R 
F2 = ABS(S — F1) 
IF(DNS.LT.F2) DNS = F2 
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2 
RETURN 
END 


| CON TINUE 


unde: X — vector al statisticilor de ordine (real) 
N — dimensiunea vectorului X (intreg) 

Schema logică este asemănătoare cu cea a subprogramului funcţie 
DNE. Valorile calculate se compară cu valorile tabelate pentru a 
accepta sau respinge ipoteza. 

12. Calculul valorii funcției Moore dată de expresia 


0 pentru z <'0 


F(x, 9) =4 v/max (a) pentru 0 < z > max(a) 
1 pentru œw > max (a) 


se face cu ajutorul subprogramului functie FM a cărui schema logică 
este data in fig. 5.11. 


FUNCTION FM(X,N,X1) 
DIMENSION X(N) 


FM = Ø. 
IF(X1.LE.Ø) RETURN 
XM =ð. 


DOI I-—1)A 
IF(X M.LT.X (1) XMU=X(1) 
1 CON TINUE 
IF(X M.LE.O.) GO TO 2 
IF(X1.GE.X M)GO TO 2 
FM = X1/XM 
RETURN 
2 FM =1. 
RETURN 
END 


X — vectorul statisticilor 
(real) 
N — dimensiunea vectorului 
X (întreg) 
X1 — valoarea argumentului 
funcției (real) 
Observatie:  Vectorul X a fost 
presupus neordonat. Dacă X ar con- Fig. 5.11 
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"ține valorile in ordine crescătoare, în locul instrucţiunilor 5—8 
s-ar pune instrucţiunea : 


|| XM = X(N) 


restul instrucțiunilor ráminind neschimbate. 
13. Cu subprogramul funcție FM de la punctul precedent se 
poate scrie subprogramul funcţie FN pentru calculul functiei. 


F(x) = (1 —1/n) F(a, 0) 


FUNCTION FN(X, N,X1) 
DIMENSION X(N) 

FN=(1.—1. /FLOAT(N))*FM(X,N,X1) 
RETURN 

END 


unde : 
X, N şi X1 au aceleaşi semnificaţii 
ca la punctul 12. 

14. Statistica Kolmogorov — Smirnov 
pentru date trunchiate dati de formula 
(8.3) conduce la subprogramul functie 
DNT a cărui schemă logică este dată în 
fig. 5.12 


FUNCTION DNT(X,N,T) 

¡DIMENSION X(N) 

DNT =Ø. 

S = Ø. 

R — 1. [FLOAT (N) 

Ni Y Y 

DOTS 1,01 

IF(X(1).LT.9)G 0 TO 1 

F1 = ABS(S — X(1)) 

IF(DNT.LT.Fl) DNT = F1 

IF(X(I--1)GT.T) GO TO و‎ 

PL = ABS(S — X(I4-1)) 

IF(DNT.LT.FA DNT = 1 
1 | | 8 + 

FL = ABS(X(N)) — 1) 

IF(DNT.LT.F1) DNT = 1 
2 | |P1 = ABSIT — S) 


IF(DNT.LT.F1) DNT = 1‏ سم 
(RETURN ) RETURN‏ 


Fig. 5.12 END 


{T1 a an | 
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bo 


unde : 
X — vectorul statisticilor de ordine (real) 
N — dimensiunea vectorului X (întreg) 
T — pragul de trunchiere (real) 
Am presupus că valorile din vectorul X sînt în ordine crescătoare. 
Observaţie. Statistica Kolmogorov-Smirnov pentru selecţia, cen- 
sorizată dată de formula (8.6) se obţine cu funcţia DN T luînd pentru 
T valoarea X(F). 
15. Corespunzător testului lui Massey dat în paragraful 10 se 
poate serie subprogramul funcție DM A X a cărui schemă logică este 
dată în fig. 5.13. 


FUNCTION DMAX(X,N) 


DIMENSION X(N) 
'XM =. 
DO1I=1,N 
1| | XM = XM + X(I) | 
XM = XM [FLOAT(N) 
S — g. 
DO2I=1,N 
Xi = X(I) — XM r- 
S= S + X1* X1 | 
S = SQRT(S|FLOAT(N)) Le 
DMAX =@. 
DO31=1,N 
= AI XMS E 
Fl = FI(Y) 
F2 = SN(X,N,E) 
F3 = ABS(F2 — F1) 
IF(DMAX.LT.F3) DMAX = F3 
3 | [CONTINUE 


Y=(X(1)-XM)/S] 
Fl=FI(Y) 
F2=SN(XN Y) 
۴32۳2-۴۱۱ 


e 
END Fig. 5.13 
unde : 


X — vectorul statisticilor de ordine (real) 
N — dimensiunea vectorului X (intreg) 


Au fost folosite subprogramele functie FI (capitolul 1 punctul 5) 
şi SN (punctul 2). 
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CAPITOLUL 6 


“TESTUL CRAMER-VON MISES. TESTUL ANDERSON-DARLING 


1. Introducere. Definiţii 


Ne propunem să verificăm ipoteza conform căreia variabila 
aleatoare X are funcția de repartiție F(x) continuă, F(x) fiind cunos- 
cută. Dacă reprezentăm grafie funcţia de repartiție empirică F(a), 
atunci, pentru valori mari ale lui », gr: aficul funcţiei F (£) vai aproape 
sigur în vecinătatea graficului funcţiei de repartiție teoretice F(a) si 
prin urmare, ab; aterile F(a) = Fa s) vor fi mici uniform. Von Mises 
sugerează ca măsură a abaterii funcțiile F,(x) de la F(x), media pa- 
tratelor abaterilor după toate valorile posibile ale argumentului z. 
Prin urmare, statistica propusă de von Mises este bazată pe o metrică 
patraticá, fiind o statistică „omnibus” în sensul că discrepantele de 
diferite forme pot da aceeaşi valoare a statisticii propuse. 

Definitia 1.1. Statistica 


Too 
(1.1) NO = N | (F(x) — F(a) [2 dF (a) 
-0 
se numeşte statistica Cramér-von Mises. 
TE 1.1. 


E 1 V4j + 1e" K 1(2), 
n> 재 @ j=0 4 


; NE LAM 4 ^ 
unde. z} = ( j+ * eris) a ie) este functia Bessel modificată. 


Anderson, Darling (1952) dau tabele satisfácind 
lim Ploi < 2) = « 


1— 00 
cu 5 zecimale pentru a = 0,01(0,01)0,99 ; 0,999. 
Anderson, Darling (1954) modifică statistica w2 considerind 
statistica WZ definită de 
+00 


(1.3) W2 = A [F (x) — Fle)2p(o = A? 


—00 
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unde 


(1.4) YX) = HA — PAI. 


Definiţia 1.2. Statistica (1.3) se numeşte statistica Cramér-von 
Mises ponderată sau statistica Anderson-Darling. 

Repartiția statisticii nw? este liberă. 

Daca رل‎ < 99 호 <. < La) atUnel 


n ex ae 2 
(1.5) mat = 2 tX i ی‎ P(e] ۱ 


n 2n 


sau în cazul in care F(x) este uniformă pe [0,1] 


1 ” [2 — 1 Š 
1.6 no ——— سا‎ ۲ — a] . 
) 12n D ji dl 


ㅣ 


2. Funcţia de repartiție a statisticii mw; pentru selecţii de volum mic 


Propoziția 2.1. (Marshall (1958)) Funcția de repartiție a statisticii 
nor : F (z) = P(no2 < 2) pentru n = 1, 2, 3 este 


AD" z < 19 
$ 1/2 
(2.1) Ti = G "uj , 112«2« 1/3 
1 차 2 
0 : 2 > 1/24 


m لو‎ 124< > 5/48 
24 


1/2 z — 5/482 
2 اس‎ NA i ae + eee , 
24 4 24 z — 1/24 


5/48 > 2 > 1/6 


(2.2) Je) 1/12 1 1/2 5X2 
1 3r Pret aid que (a) L 
?—34]| 3 z — 1/24 ^ 
35 1 1\112 1 5 1/2 
RN Buc (NAS od | بح‎ te LOT < 20 
RET 3) An. i 
1 , "27808 
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și respectiv 


0 2 < 1/36 
8 ㅠ 688 , 1/36 < e < 1/18 
سید‎ n| 32 0 a Pe ره نب‎ ec WA ls 
3 9 
(2.3) Poe) = 1.2. s (3 2) am (agus — aut y ا‎ 
3 27 
Mt 1 
+ 66927 (1, pu y 
6 
1 ATA ap aos 


celelalte intervale ce apar în (2.3) fiind : 


MUN! NY 2 a (Ga 
(> d ls = (a i) Po aet لا‎ 


unde č = z — 1/36 si V(1, a) este volumul obţinut din intersecţia 
sferei cu raza unitate gi cu centrul in origine cu două plane : z—a si y —a. 
Marshall (1958), folosind metode numerice, obtine tabelul 2.1. 


Tabelul 2.1. 


Valorile funcţiilor de repartiție ale statisticii nc; pentru n —1, 2, 3 și repartiţia 
asimptotică în punetele alese 


| 


Fy) Fa(2) Faz) F(z) 
0, 11888 0, 37708 0, 46692 0, 47343 0, 50000 
0, 14663 0, 50318 0,57614 0, 57683 0, 60000 
0, 16385 0, 56751 0, 63384 0, 63009 0, 65000 
0, 18433 0, 63560 0, 68842 0, 68521 0, 70000 
0, 20939 0, 71009 0, 73974 0, 74194 0, 75000 
0,24124 0, 79475 0, 79126 0, 79924 0, 80000 
0, 28406 0, 89605 0, 84515 0, 85481 0, 85000 
0, 34730 1, 00000 0, 90296 0, 90617 0, 90000 
0, 40520 1, 00000 0, 94007 0, 93661 0, 93000 
0, 46136 1,00000 0, 96554 0, 95723 0, 95000 
0, 54885 1, 00000 0, 98968 0, 97793 0, 97000 
0, 74346 1, 00000 1, 00000 0, 99680 0, 99000 
1, 16786 1, 00000 | 1, 00000 1, 00000 1, 00000 


Din acest tabel se observă că, in coada repartitiei, convergenta 
către repartiția asimptotică este rapidă. 
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3, Punctele percentilice ale statisticii W^ pentru diferite 
volume de selecție 


Propoziția 3.1. Avem 


1 RE, EMIT i 32N2 — 61N +: 
(Wa) =—, p (Wk) =, ya) = SAN? — 61N + 30, 
6 180N 38780N2 
496N? — 1532N? -L 1671N — 630 
ba WR) = E 
(5600N3 


Folosind aceastá propozitie, Pearson, Stephens (1962) obtin 
repartiţia pentru Wî, si examinează convergenta punctelor de semni- 
ficatie. 


Tabelul 3.1. 


Punctele percentilice ale statisticii Wo (obţinute prin interpolarea grafică în funetia de 
repartiție empirică) si wi, 


Coada inferioará Coada superioará 


Pragul de ۱ 
semnificaţie (%) Wo wa, Wi, we, 


0,1 0,018 — 0,14 1,168 
0,5 0,023 — 0, 840 0, 8704- 
1,0 0,0266 0,0248 0, 720 0, 743 
2,0 0,0305 0,0288 0,594 0,620 
t 2,5 0,0322 — 0,561 0,581+ 
3,0 0,0333 0,0318 0,533 0,549 
4,0 0,0356 0,0343 0, 486 0, 499 
5,0 0,0377 0, 0366 0,452 0, 461 
6,0 0,0389 0,0387 0, 423 0,430 
7,0 0,0410 0, 0406 0, 400 0,405 
10,0 0, 0477 0, 0460 0, 348 0, 347 
15,0 — 0,0543 0,287 0,284 
20,0 0,0646 0, 0622 0, 244 0,241 
30,0 0, 0805 0, 0786 0,187 0,184 
40,0 0,100 0,097 0,151 0,147 
50,0 0,122 0,119 0,122 0,119 


+ Obtinute prin interpolare din tabela lui Anderson, Darling, (1952), Pearson, 
Stephens (1962). 


Punctele de semnificaţie pentru ۶ şi W$ date în tabelul 3.2 
au fost obţinute prin interpolare din funcția de repartiție adevărată 
din tabelul 2.1, iar cele pentru W? si W3 prin ajustarea acestei re- 
partitii prin curba S5 a lui Johnson (1949). Repartiția $ este definită 


1$ = 0 271 177 


prin următoarea, transformare : 


(3.1) جد چ‎ + dn RERO i ARN e OA 
QUA oe 
"unde 2 ~ N(0,1). 
Tabelul 3.2. 


Puncte percentilice pentru dlierite volume de selecţie. 


Pragul Din curba Sg Din selecţie 
de semnificație dni SUI 

(%) We LE Ws Wio Wio Woo 

10 0,343 0,337 0,341 0,343 0,348 0,347 
5 0, 424 0, 440 0,445 0, 453 0, 452 0, 1 
2,5 0, 490 0, 532 0,550 0, 568 0, 561 0, 581 
1 0, 550 0, 637 0, 687 0, 722 0, 720 0, 743 
0,5 0, 583 0, 706 0, 785 0, 835 0, 840 0,870 
0,1 — — 0,99 1,08 1,14 LIA 


Pearson, Stephens (1962) 


Tiku (1965) presupune că 


(3.2)  W&—N | [Put 


—00 


— F(z)]dF(z) ~ a, + bl), 


unde a,b, si f, sint determinati astfel încît Wẹ si a, + bf) sá 


„aibă aceleaşi prime 3 momente. Găsim 


98 N(AN — 3)? 
fi EUREN | 


32N2 — 61N + 30 
5 (32N? — 61N + 30)?’ 


84N(4N — 3) 


iT / 


336N? — 959N + 609 - 
210(32N? — 61N + 30) 


"o 

Aproximatia (3.2) nu poate reproduce valorile lui W% mai mici 

«decit a,, în timp ce valoarea minimă adevărată este 1/(12N). Valorile 

lui a, si رز‎ pentru un număr de valori ale lui N sînt date în Tabelul 3.3. 

Pentru a înţelege mai bine aproximatia, s-au calculat valorile lui Ba 
pentru repartitia adeváratá si aproximativá. 
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Tabelul 3.3 


Valorile lui Bouton A dd ALOE IDES RR 


N | A id Pentru xy? ~~ | Pentruy? | Adevárate | Diferența — A devărate | Diferenţa 
4 | 1,9396 0, 0343 9,19 8, 42 0, 77 
5 1, 7468 0,0382 9,87 8,32 0,55 
6 1,5253 0,0406 10,34 9,94 0,40 
10 1,4463 0,0447 | 11,29 11,23 0, 06 
25 1,6578 0, 0475 12,04 12,24 —0,20 
50 1,2644 | 0,0490 12, 49 12,87 —0, 38 
00 1,225 . 0,05 12,79 13,29] —0, 50 


Tiku (1965) 


Tabelul 3.4 arată valorile funcției de repartiție ale statisticii 
W3 calculate cu ajutorul aproximatiei (3.2) în comparație cu va- 
lorile exacte date de Marshall (1958). 


Tabelul 3.4 
Valorile P(Wy<z), N=3 

z 0,1189 | 0,1638 | 0,2094 | 0,2412 | 0,2841 0,3473 
Aprox. (3.2) 0.4575.  0,6127| 0,727 0,7876| 0,8484 0,9085 
Aprox-A dev. —0,0159| —0, 0174] —0,0146| —0,0116| —0,0064| —0,0023 

z | 0,4052 | 0,4614 0,5488 0,7435 0,1679 
Aprox. (3.2) 0,9425 | 0, 9634 0,9820 0, 9963 0, 9999 
Aprox.-A dev. 0,0059 | 0,0062 0,0041 — 0,0005  |— 90,0001 


Tiku (1965) 


Din (3.2) tinind seama de 


IN 1 
Pael 이스 2) = Na? UN] (ix -|- 1 


(3.3) 
(N + 3/02N?) > 2 <(N + 6)/02N?), 


unde y = |z — 1/2N) Şi a = arccos(a/y), obţinem tabelul 3.6 
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Tabelul 3.5 
Compararea « — punctelor percentilice superioare ale statisticii we. 
x 


0,5 0,1 0,05 0,025 | 0,01 0,005 0,001 


NS Aprox (3.2)/0,122 0,344 0,442 0,541 0,672 0,771 1,004 
2 Sp — 0,341 0, 445 0,550 0, 687 0,785 0,99 


Aprox. (3.2) [0,117 0,348 0,455 0,563 0,708 0,819 1,080 


자 =10 Sp — 0,343 0, 453 0,568 0,722 0,835 1,080 
Monte Carlo 2 0,348 0, 452 0,561 0,720 0,840 1,14 
+ S.E. +0,003 |+0,005 | £0,007 |--0,013 |+0,019 |+0,05 


Aprox, (3.2) |0,112 0,352 0, 467 0, 584 0, 743 0, 866 1,153 
N = oo {Sp — 0,345 0, 457 0,578 0, 746 0, 877 1,18 
0,581 


A simptotic 0,119 0, 347 0,461 0, 743 0, 870 1,168 


Tabelul 3.6. 
Puctele percentilice în coada inferioară pentru Wi 


i 0,005 0,01 0,025 0,05 | 0,10 
N 
2 0,0426 0,0433 0,0457 0,0496 0,0576 
3 0,0312 0,0332 0,0377 0,0436 0,0529 
4 0,0273 0, 0300 0,0354 0,0415 0, 0509 
5 0,0287 0,0287 0, 0342 0, 041 0,051 
8 0,025 0, 027 0, 033 0,039 0,048 
10 0, 024 0, 027 0, 032 0, 038 0,047 
20 0,022 0,025 0,031 0,037 0,047 
00 — 0,025 سب‎ 0, 037 0,046 


Stephens, Maag (1968) 
Punctele în coada superioară sînt obţinute cu ajutorul aproxi- 
matiei y? si toate punctele pentru N = co sint calculate cu ajutorul 
repartitiei asimptotice (1.2). 
Tabelul 3,7 
Punctele percentilice în coada superioară pentru wÈ 


0,025 0,01 | 0,005 


0,05 


2 0, 343 0, 424 0, 490 0,550 0,583 
3 0,337 0, 423 0,509 0, 662 0,707 
4 0,341 0, 435 0,529 0, 653 0, 747 
5 0, 343 0,441 0,540 0,671 0,771 
8 0,346 0,451 0, 556 0, 698 0, 806 
10 0, 347 0, 454 0,562 0, 707 0, 818 
20 0,349 0, 459 0,572 0, 724 0,841 
00 0, 347 0, 461 0,581 0,743 0,870 


Stephens, Maag (1968) 
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4. Componentele statisticilor Cramér-von Mises si Anderson-Darling 


4.1. Statistica Cramér 
Ne propunem să verificám, cu ajutorul statisticii W2, ipoteza 
H,:0 = 0, faţă de H,:0 = 0, = 0, + yn"? 


unde 0 este un vector p-dimensional care specific’ complet funcţia 
de repartitie F(y, 0) a datelor initiale si y este un vector constant. 

Odată calculată valoarea statisticii W? putem decide dacă accep- 
tám sau nu ipoteza Ho, însă nu putem sti ce aspecte particulare ale 
«datelor au condus la această concluzie. De aici rezultă importanţa 
partitionárii statisticii W% într-o mulțime de componente, fiecare 
masurind un anumit aspect al datelor. În acest mod, în luarea deci- 
ziilor finale, putem să determinăm semnificaţia componentelor indi- 
viduale si să stabilim ce a produs neconcordanta datelor eu ipo- 
teza Hy. 

Durbin, Knott (1972) reprezintă statistica W? sub forma 


oo 


(4.1) Wi=Y Un), 
j=1 

unde 

(4.2) Zaj = E X cos (774) 


sint componentele principale ale lui y,(z) = /n(F, (2) — 2), 0<x<1. 
Din (4.1) observăm că, contribuţia componentelor 


nar semi ees‏ وروت 


în W; scade rapid cu j. Cum examinarea acestor componente repre- * 
zintă o sursă suplimentară de informaţie privind deplasarea de la ipo- 
teza, nulă, este necesar să fie calculate şi considerate separat compo- 
nentele. Variabilele aleatoare w; = cos(jra), unde x este uniformă 
pe (0,1), sint independente şi identic repartizate, astfel încît 2,, este 
repartizată la fel ca şi 2,, pentru toti j si n. Din teorema limită centrală, 
pentru n — co, رت‎ converge către o variabilă normală. Din tabelul 
4.1 se vede că convergenta este rapidă şi aproximatia normală este 
bună chiar cînd » este mic. 
Dacă este adevărată ipoteza H,, asimptotic, 24, sint variabile 
aleatoare independente gi identic repartizate N(y'5,, 1), unde 
1 


(4.3) 5, = 1319 (072)09(2) de, j = 1,2, 


. 0 
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cu g(x) vectorul derivatelor 9F(y, 0)/00 in 6, exprimat ca functié de 
æ cu ajutorul transformării æ = F(y, 00). 
Tabelu 402. 


Punctele percentilice pentru componentele Z,j- Dacă valoarea tabelatá 
este 2, PUnj >= a 


4 
ups 10% 5% 2,5% 1% 
n | 
4 1,3048 1,6501 1,9486 2,2459 
5 1,3085 1,6507 1,9338 2,2591 
6 1,3000 1,6526 1,9424 2,2613 
7 1,2981 1, 6494 1, 9460 2,2730 
8 1, 2959 1, 6492 | 1, 9467 2, 2809 
9 1,2941 1, 6487 1, 9484 2, 2856 
10 1, 2929 1, 6482 1, 9496 2, 2899 
15 1,2890 1,6470 1,9530 2,3023 
20 1,2871 1,6464 1, 9548 2,3085 
25 1,2860 1,6461 1,9558 219121 
50 1,2837 1,6455 1,9579 2,3193 ۲ 
00 1,2816 1,6449 1,9600 2,3263 


Durbin, Knott (1972) 


Cunoscind semnificatia a p componente individuale, putem fi 
interesați în cunoaşterea faptului dacă partea din Wi; rămasă după 
ce aceste componente au fost extrase este ea însăşi semnificativă. 
În acest scop, avem nevoie de punctele de semnificaţie ale statisticii 


P 
72 m2 124-2 
W PAIN $ Za (9^0) 
j=1 
"Deoarece nu cunoaștem repartiția acestei statistici pentru selecţii 


de volum finit, vom folosi punetele de semnificaţie asimptotice ale 
statisticii 


p 29 co ^2 
(4.4) gos ct rA ex cs 는 L8 
4 2 Jîr en jr 


unde 2,,2,,... sint variabile aleatoare independente repartizate 
N(0,1) 


Durbin, Knott (1972) folosese ca primă aproximaţie a lui B2, 


(4.5) B= y 


unde k este un întreg pozitiv convenabil ales Şi 22 ~ X2(v),A si y 
fiind alese astfel încît Ba are aceeaşi medie gi dispersie ca ۰ 
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e 


Tabelul 4.2 
Punetele percentilice ale ea (4.4) 
P(B? < valoarea tabelată) = P(B? aB}, 1-4) =1—« 


| 
| 0,500 0, 800 0, 900 0,950 | 0, 990 | 0,999 
| 
| | 
Bh = W? 0,11888 | 0,24124 | 0,34730 | 0,46136 0, 74346 | 1,16786 
B?, 0,05439 | 0,08947 | 0,11678 | 0,14522 | 0,21501 | 0,32051 
B2, 0,03532 | 0,05295 | 0,06583 | 0,07884 0,11000 | 2 
B?, 0,02618 | 0,03713 | 0,04482 | 0,05242 0,07023 | 0,09647 
BY, 0,02080 | 0,02842 | 0,03362 | 0,03868 0,05032 | 0, 06720 
Ba 0,00935 | 0,01152 | 0,01288 | 0,01414 | 0,01688 | 0,02062 


Durbin, Knott (1972) 


Din compararea valorilor Bj, Bi, Di, B2, Di, Bi, reiese cit de 
rapid descreşte contribuţia componentelor succesive cînd j creşte. 

Daca considerăm verificarea ipotezei H,:y~N (0,1) faţă de 
iH, : yo 2۷ ) (rin, 1) (deplasarea mediei), atunci 


1 مب‎ —0)a 
Fly, 0( اسب‎ 72" ay = Oy — 0) 
oF ôF 
~ 0 El 
pr e(y و‎ A p(y) 
gi 
(4.6) g(z) = —o(y), unde v = (y) 
ii) H,:y ~ N (0,1 + y//m) (deplasarea dispersiei), atunci 
1 r 4 3/8 
Fly, = d 972۳ = ۵0/۷ 
or 1 
= مس‎ VI Ai Rt AIRES VI ine 
9 A Tee fa z Ye) 
şi 
1 
(4.7) g(x) = cg $9 unde x = ®(y). 


Deoarece componentele z,, pot fi folosite atit unilateral cit si 
bilateral, după cum este cunoscută sau nu direcţia schimbării de 
la zero, vom considera puterea atât în cazul unilateral cit şi în cazul 
bilateral. 
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La un prag de semnificaţie « = 0,05 verificám ipoteza 


Hy: y = 0 fata de Hy: y = 11 


Pentru cazul i) cea mai bună statistică este y şi într-un test 
bilateral respingem H, dacă 


ny | > u a 1,96. 
2 


Ín situaţia unilaterală (bilaterală) y, — 1,64485 (1,95985) si 
Yı = 3,28971 (3,60482) pentru o putere a testului egală cu 0,50, 
respectiv 0,95. 


Cum, asimptotic, /n(y — y,//n) ~ N (0,1), urmează că 
0,50 = 1,96 
zly) ۹1 9 2 E 3 à 
0,95, y, — 3,605 


Pentru cazul ii) cea mai bună statistică este s? si ţinem seama că, 
asimptotic, 


89001 + yn) ~ N(0;2/m) 
Astfel, cele două mulţimi de valori ale lui y, pentru cazul ii) pot 


fi obţinute din cele din cazul i) prin multiplicare prin ya. În cazul 
unilateral, puterea asimptotică a testului bazat pe 2,, este 


TY) = P(2,,2 M-a] Ay) = P(z,; — 118 > M-a — 11851 H,) 
si cum 2,; — y,8, ~ N(0,1) dacă este adevărată ipoteza H, urmează că 
(yı) = 1 — (ua — y18,) = 1 — O(1,6449 — y,8,) 


pentru « = 0,05. 
În cazul bilateral, puterea testului bazat pe 2,, este 


z(vi) = P(|z,] > u, aH) en done VPN PO Gne M 2 0 Yı 3] 
j 2 


CU U a= tog = 1,96. 
a 


Pentru a găsi puterea asimptotică a testului bazat pe statistica 


W? = Y, 20/3272) 


jei 


aproximăm statistica W? prin 


3 zis 


k 
(4.8) = A ja 
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unde 2? ~ y?(v, u?), A si v fiind aleşi astfel încât 
1 1 
M(W?| Ho) = M(W?| Ho) iri 


D\W?| Ho) = D(W?| H,) == 


3i u? astfel incit M(W?|H,) să fie corectă. Întregul k este ales prin 
încercări (poate fi atinsă o acuratețe satisfăcătoare pentru k = 20). 
Deoarece 


1 


(4.9) M(W*|H, = M(W*| Ho) + y? Y M. نت‎ rto dz, 


j=1 IRA 6 


0 


condiţiile anterioare puse asupra constantelor A, v si u? conduc la 


m 1 
~ + Av = — 
Ape ó 
et 1 
2 — + 9020 = — 
(4.10) ¡aj 45 
9; 
Y e Ts = vote) da 
j=1 
0 


Pentru « = 0,05 şi p = 0, puterea asimptotică a testului bazat 
pe W? este 


x = P(W?> Boa-oos) = P(W?> 0,46136) 
şi folosim aproximarea anterioară. 
Puterea asimptotică a testului bazat pe 
oo 


(4.11) 2^ ali + 1}, 


da, ... fiind variabile aleatoare independente repartizate normal‏ موه 
cu dispersia unu, este‏ 


P(A? > Aja) = P(A? 2,492) 
pentru a = 0,05. 
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Tabelul 4.3 


Puterile asimptotice ale componentelor si ale statisticilor Ww} si AZ fata de deplasările medies 
si dispersiei in situatia unilaterala. 


Deplasarea mediei Deplasarea dispersiei 
Test unilateral 


Puterea celui mai bun test Puterea celui mai bun test 


bazat pe 
0,50 0,95 0,50 0,95 
| 

Zi 0, 466 0, 930 0,05 0,05 
Zas 0,05 0,05 0,336 0, 787 
Zi 0,106 0, 197 0,05 0,05 
we 0, 342 0,877 0,072 0,371 
A 0, 354 0, 890 0,298 0, 862 


Durbin, Knott (1972) 


+ Dacă folosim coada superioară ca regiune critică, atunci (—1) za este 
statistica test. 


Tabelul 4.4 


Puterile asimptotice ale componentelor si ale statisticilor wi si AR fata de deplasările me- 
diei și dispersiei în situația bilaterală 

자‏ اا ae A) A A N‏ سس یس 
Deplasarea mediei Deplasarea dispersiei‏ 


Test bilateral 


Puterea celui mai bun test Puterea celui mai bun test 


bazat pe 
0,50 0,95 0,50 0,95 
ی‎ ONG Je TRE sa AR A SE, ai duba DAE ARA. امس‎ CLON BL nd a IN 
Za, 0, 460 0, 928 0,05 0,05 
Zu 0,05 0,05 0, 307 0, 763 
Za 0,076 0,140 0,05 0,05 
rA 0, 05 0,05 0,123 0,303 
we) 0, 457 0, 928 0,085 0,258 
AS 0, 472 0, 938 0, 401 0,889 


Durbin, Knott (1972) 


¢ Testele bazate pe w2 şi AL folosesc numai coada superioară. 


Observaţie. Testul bazat pe prima (a doua) componentă se folo- 
sește pentru punerea în evidenţă a deplasării mediei (dispersiei). 
Stephens (1974) reprezintă statistica W2 sub forma, 


AB e i 
(4.12) Wy, 
nT? ji j” 
unde 
(4.13) fap = Y cos (jra) 
$21 
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şi veritică ipoteza, 


Hy: ~ N(0,1) față de Ha: N (11//m,1 + afl). 
Componentele corespunzătoare ale lui g(x) sint 


(4.14) glo) = —ely) si gato) = —L oly) 


unde 2 = (y). 
Asimptotic 2,, ~ N (13, + 2842, 1). 
Daca este adevărată ipoteza nulă, atunci media, dispersia şi 
cumulantul de ordinul 3 ale statisticii W? sînt 
0,1666; 0,0222 şi respectiv 0,008466. 
În ipoteza H,, avem 
u = MW? = po + Y (CPT?) = po + 390772); 
1 Fi 
(415) Jo? = وه‎ + 3.94 0555; 
Hy = 36, + 319;/(j915) 
a 


unde 
Lă “ec Rp > : 12 
Q; = (185)? = (1181 + 72342)”. 
Pentru testul de normalitate 3, ð; — 0 pentru toţi j. Astfel, 
2; (22) va avea media y,3,¡(y28,2) şi testul bazat pe ea are o putere 
constantă pentru orice schimbare în medie (dispersie) pentru toate 
schimbările în dispersie (medie). 
În consecinţă, aceste două statistici detectează numai schim- 
bările în medie sau numai cele în dispersie. 
Cu notatiile 


(4.16) Ay = har pee Ne Mi ys i15 
(4.15) devine 

u = po + vidn + YEA ss 
(4.17) g? = 00 ~ 4(iAa nt 13423) ۰ 


S. ya K 50 le 24(yiA 31 ate a 4:32). 
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Folosind o idee a lui Pyke (1959), dezvoltată de Brunk (1962) 
şi Durbin (1968) care consideră z, ca un proces stochastic cu para- 
metru discret 7, Durbin, Knott (1972) consideră drept analog al 
statisticii W4 în funcţie de 21, x, ..., n, expresia 


(4.18) My ett > (a Lom 
n ¡a ^ +1 
8i o pun sub forma 
(4.19) MESS C Nus y کے ) ندر‎ ( 
An(n سا‎ 2) j=l 2n + 2 
unde 
(4.20) Cu = 22 E sin (Ye Mind ) 
2n + 2]; n +1 n 4-1 


sînt necorelate cu mediile zero şi dispersia unu. 
Statistica M3 se mai poate serie ca 


1 


(4.21) بویا‎ ps |16) ds 
n 12” 


0 


unde G,(z) = (۳ + 2) + 1). 


4.2. Statistica Anderson-Darling 
Statistica (1.3) cu F(x) = x poate fi serisá in forma 
1 1 
(4.22) AR =h 00000 — 092 de = [tt or ae. 
0 0 
Durbin, Knott (1972) reprezintă statistica A2 ca 


00 


(4.23) ud usi LaL Eus unt 
Aun” 
unde 
94 1142 ۶ 
(4.24) ee [구기 y P22, — 1). 
۱ r=1 


L 


unde P,(2) este polinomul Legendre de grad j, definit ca coeficientul 
lui h în dezvoltarea după puterile lui ha expresiei (1—22h+h?)-12, 
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Spre deosebire de 2, 2% nu au aceeaşi repartiție, exceptind 
cazul valorilor mari ale lui ۰ 

Cu ajutorul statisticilor 2%, Neyman (1937), Barton (1953, 
1955, 1956) construiesc teste de ajustare care au o putere mai mare 
decit testul X? pentru unele alternative netede. 

În particular, (4.24) devine 


(4.25) 2,1 —l3nu 


gi 


WR 1/2 زر‎ = | ah 
22 = 7 y (3u; — 1) $ 5n | B 5 


=1 


ج 
bo‏ 
ES‏ 
= 
m‏ 


n 
u, = 224, — 1, B = Y ۰ 
t=1 


Variabilele wu, sint repartizate uniform pe (—1, 1). Stephens 
(1966) dă punctele percentilice ale statisticilor 4 si B astfel încît pot 
fi construite teste bazate pe aceste componente. 


5. Statistici Cramér-von Mises generalizate pentru repartiția gama 


5.1. Componentele statisticii Cramér-von Mises generalizate 
Ne propunem să verificam ipoteza 
Ho OT ola)? == GATO) 


unde 


= 1 x 
6.2 = la dy = Arena, 
0 0 


« fiind specificat şi 0 putind să fie sau nu cunoscut. 
În acest scop, considerăm statistica (De Wet, Venter (1973 a, b)) 


(85)... A | {P (2) — Par)? buf Pola) AF (a) 
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sau cu i = F(x) 


1 
(5.1) R? == 172) da) = n| (ento — fj Y(t) dt 
0 
unde F, este funcția de repartiție empirică si 
(5.2) halt) = [Jalt)ga{Falt)}7]*; 
Jai) = sup {a> Gao) — ty. 
Definitia 5.1. Statistica (5.1') eu v,(é) dat de (5.2) poartă numele 
de statistica Cramér-von Mises generalizată. 
Dacă notăm prin L;(z) polinomul Laguerre de ordin n definit 
prin 
xt co 1 


(5.3) AH و‎ AD 
^ ( t) Eri T(n +a + 1) 


Lea) ۳ 


atunci ni admite urmátoarea descompunere (Pettitt (1978)) 


(5.4) mdr 
j=1 
unde 
rw 3 1/2 n 
(5.5) Za = ad RE | Y 1542410) 
1 (a e J) 1—1 


care asimptotie sint echivalente cu 


| Ta + j) A “Am ap 0 


Lin fiind statisticile de ordine corespunzătoare selecţiei 41, Loy. . ., 2s. 

Variabila aleatoare (5.4) tinde la infinit cînd n — oo ceea ce 
necesită recentrarea ei in scopul obţinerii repartitiei limită. Rf are 
media infiniti, însă există constantele (up! astfel încît repartiţia 
lui R2 — y, tinde către repartiţia statisticii 


unde Z,, Za, ... sînt variabile aleatoare independente repartizate 
N (0,1). 
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Dacă 0 este necunoscut si este estimat prin 0.— رو‎ atunci 
scriem f = Gal zil 0). Statisticile Z,, si E; se calculează folosind 
în locul lui t;, .وا‎ Cum Z,, = 0 


(5.4) Ê, = y j. 
je 


Asimptotie, 해 sînt independente și repartizate .N(0,1). 
Repartiția statisticii R? — رم‎ unde Ün sint constante conve- 
nabil alese, tinde la aceea a statisticii 


Bii — de 
j=2 


De Wet, Venter (1972, 1973 b) au tabelat funcțiile de repartiție 
ale variabilelor A si B. 


5.2. Verificarea exponențialităţii (cazul « = 1) 


În acest caz, avem 
H(t) = —{(1 —tlog(1 — 107 


Zi = n”? )1 — 3/0) şi Za = nV? ] 1 — 28/0 + ——— 
7 


A A 
Statistica Zin = 0, si, din (5.5), Za este asimptotic echivalentă cu 
S, = —2nM? + n7V* Y mu là 


unde m, > ...- m, sint mediile statisticilor de ordine Hntr-o 
selecție asupra unei variabile exponentiale de medie unu; m, ~ 
~ —log {1 — i/(m + 1)}. 


5.3. Eficiența asimptotică relativă a componentelor statisticii RZ 


Pentru a vedea eficienţa asimptotică a componentelor statis- 
ticii R} ca teste pentru verificarea ipotezei nule conform căreia, 
repartiţia este exponențială, vom considera ipotezele alternative 

a) repartiţia este Weibull cu funcţia de repartiție) 


G(x) = 1 — exp (—(2/0)) 


19% 


b) repartiţia este gama cu densitatea 


1 
g(x) = PTO 


c) repartiția este polinomială Laguerre cu densitatea 
۱ i get 
g(x) = 07 en + (1 — A) (: — 90-1 (fen 


Deci vom verifica ipoteza 
Hor K= față de y: me joues ^ 
cu 0 parametru nedorit. 


Testul asimptotic cel mai puternic pentru verificarea ipotezei 


Hy fata de H, foloseşte estimatorul de verosimilitate maxima i pentru 
A si 


q 1 e—2/0 


N(A, 6/(z?n)), alternativa a) 


A ~ 4 N(A, 0, 645 1-1), alternativa b) 
N(a,n-1), alternativa c) 


^ 


Definim eficiența componentei Z;, prin 


ei(Z,) = Lade: P^ MZ Perr) J | uim D*(Z, HM 


A=1 


şi eficiența asimptotică relativă prin 


EAR (Za, 2) = [ef (Z,,) et ÎI 
Găsim 
0,608(j — 1)-2(j = 2, 3, ...), alternativa a) 


BAR (Zn, A) = 4 0,645/j2, alternativa b) 
0,7 = 3, 4, ...5; زرد‎ = 2, alternativa c). 


6. Statisticile Cramér-von Mises pentru verificarea normalitátii 
in selectii censorizate 


6.1. Statisticile Cramér-von Mises modificate 
Fie 2, > 8a > ... > V, Statisticile de ordine corespunzătoare 
unei selecţii de volum » asupra unei variabile aleatoare X avînd 
funcţia de repartiție P continuă. 
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Ne propunem să verificám ipoteza 


H, : Fux) = F(a, 0) 


unde F(z, 0) este o functie de repartiție cunoscută, 0 (vector) fiind 
parametru. 

Distingem două cazuri 

1. Dacă 0 este cunoscut, notăm F(z, 0) prin F(x), F(s) fiind 
o funcție de repartiție complet specificată. Cu += F(a) selecţia 
dublu censorizata are forma 


OLS dq cu unser do IE x AA 


in censorizarea de tipul I avem la dispoziţie numai observaţii 
n intervalul (p, q) fixat; numárul acestor observatii este aleator. 

in censorizarea de tipul II este censorizat un număr fixat de 
observatii; in statistica modificata 


p 
(6.1) Wi = ۱ (F (t) — tjè dé 
q 


unde P,(t) este proporţia valorilor 4, care nu sint mai mari decit 
t, vom lua q = f, şi p = t, si statistica se serie م,‎ ۰ 

În censorizarea “simplă (care este un caz particular al censo- 
rizárii duble cind una din extremităţile selecţiei ipid fe restricționată), 
dacă q = 0, notăm ,,W; prin ,W; si luînd وا‎ = 0, s = 0, -notăm 
,W2 cu „Wa. 

Observatii: i) Selectiile censorizate apar, de exemplu, în testele 
de viață îm care fie din motive economice, fie din imposibilitáti de 
ordin tehnie, la sfirsitul testului, experimentatorul nu dispune de 
toate măsurătorile. 

ii) Censorizarea este o proprietate a selectiei in timp ce trun- 
chierea este o proprietate a repartitiei. E 

Statistica Anderson-Darling modificatá este 


b 
2 
(6.2) e AS = 4 [F,(t) — ta — te) dê 
0 
Dacă چا > ... > وا > را‎ SPD < thay < ... < tu, adică dacă E 
observaţii au valori mai miei decit p si n — R (ları, ..., fa) Sint 


censorizate, atunci 


dido aru pu VERE DRE LORS RRS 
e = 2 (^ Hr 2n ] s 12m? hi dd pci a + 


13 - e. 271 40 193 


^ft 1 He Di reat R 
(6.5) p473 = Y —— —— [log (1—4) — logt,] — 2 Y log (1 — 4) + 
$=] n ii 
2R RY , 463 
Tn E — r4 29 1] log (1 — p) + log p — pn 
n n n 
si 
(6.6) apie c AS ~~ 149. 
Punctele pereentiliee ale statisticilor modificate sint date în 


tabelele 6.1, 6.2 si 6.3. 


Tabelul 6.1 


Punetele percentilice ale statisticii ۶ 
————————————— 


3 Şi | Valorile lui p 
unctele | | 
percentilice 0.50 | 0,55 | 9,60 | 0,65 0,70 
| | 9 
ie 0, 0080 0,0095 | 0,0112 0,0130 | - 0,0149 
2,5 0,0101 0,0120 | 0,0141 |. 0,0163 | 0,0186 
5 | 0,0126 0,0150 | 0,0176 0, 0202 0,0230 
10 | 0,0166 0,0197. | 0,0230 | 0,0264  |- 0,0298 
2 0, 0536 0,0619 | 0,0707. | 0,0793 |. 0,0877 
90 0,1890 0,2153 | 0,2407" -| 0,2645 0,2861 
95 - i00: 2979 ESO BOS p.c e gaga H7: gna: 0,3861 
97,5 EE 3295 147 50,9742 "0 +, cl 0.4906 
99 | 0, 4271 | 0, 4847 | 0, | 0, 6330 
Punctele | ۱ j ار‎ 5 
i vi ae SOS فا‎ MU 0,90 | 0, 95 
| | | | | p^ 
| | | | va Aie 
| 0,0167 0,0187... |-. 0,0206: / |- 0,0214 0, 0240 
|, 00210 |, "0,0233 | .0,0256..| o; | 0,0294 
1«-.0/0258 71470,0288. 15790,0819 — | - 00344 0,0356 
| 0,0333 | 0,0367 | 0.0399 | 0,0426 | 0,0450 
| 0,0957 0,1030 .| 0,1093 0,1147 | | 0,1178 
| 0, 3048 | 0, 3205 | 0,3327 | 0,3412. | 0,3402 
| 0,4102 “| 0,4298 | 0,4446 | | . 0,4599 
| 0, 5201 | 0,5 139 | 0,5616 | | 0,5791 
| | . Oy 8997. 1440), SES 0,7419 


Pettit, Stephens (1976) 
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Tabelul 6.2. 


Punctele percentilice ale statisticii pA? 


Punctele 
percentilice 


Valorile lui p 


| Punctele percentilice pentru pA? 
| 


6:9 247 8 | 0,7 از 6ب 0,5 
| | 1 
0,152 | 0,125 0,103 | 0,084 0,067 | 1 
0,186 | 0,154 0,127 | 0,104 0,083 | 2,5 
0,223 186 ;0 0,154 0,126 0,101 | 5 
0,280 | 0,234 1,194 | 0,160 0,128 | 10 
0.676 0,587 0,504 | 0,425 | 0,249 | 50 
1,798 | 1,623 1,451 | 1,260 1,002 | 90 
2,344 | 2,146 1,920 | 1,676 1.415 -| 95 
2,915 684 ,2 2,421 | 2,112 3702 ,| 97,5 
8 | 3,419 | 3,085 | 2,707 | 2,301 | 99 


Tabeiul 6.3 
Punctele percentilice ale statisticilor ,_p. pW? si , 5.54? pentru eensorizare dublă simetrică 
EN A E cu Toe ی‎ ce tem a II RHENUS. 
(a) Punctele percentilice ale statisticii p,p W” 


—————— MMM—M—————————— 


Valorile lui p 

Punctele 1 | ㅣ | 
percentilice | 0,75 | 0,80 | 0,85 | 0,90. | 0,95 

| | | | 

| | | | | 
1 | 0,0083 = | '0,0113 رل‎ 0,0143: |, 0,0177 | 0,0221 
2,5 0,0112 ~ | | 0s0149 1. - 0,0188 |. 0,0229 ^| '0,0278 
5 | 0901477 ^1 «0,0192. | 0,0235 | 0,0288 | 0,0342 
10 | 0,0202 | 0,0260 | 0,0320 | .0,0381 | 0,0438 
50 Ph 7050748. 0,0862 | 0,0993 0,1102 lol", 9, 1166 
90 | ۲ 5402056, «10 1 0,9206, | 0,3358 | 0,3445 
95 | ly 034018 | 0,4811 1 10,4484 "||! 0,4584 
97,5 | | 0,5131 | 0,5462. | 0,5661 |. 0,5775 
99 | | 056005 |. 0.20907 ^| 0.7259" 1.0, 7401 

| | | 
(b) Punctele percentilice ale statisticii „_p,p 42 
1 |^ 0,043 | 0,061 | 0,083 | 0,110 | 0,145 
2,5 | 0,055 | 0,078 | 0,105 |. 20,137 Ll 09,179 
5 | 0,071 | 0,098 | 0, 130 |, 0,168 | 0,216 
10 | | 0,129 0,163355 10721815 1770,27 

50 | 0,402 | 0,488 | 0,578 | 0,674 
90 | | 51,922 144987 c1 74,6015.» A0 
95 | | 1,784 | 2,000 |. 2,194 |- 25362 
97,5 | RS tel a 2,7895 | 22,940 
99 | 27562 | 2,925 3/513 13-780) 


Pettitt, Stephens (1976) 


2. Dacă @ este necunoscut, statistica modificată are forma 


$ 
(6.7) wi = nl Po — cra 
q 


^ A. RA : aes viis 

unde t = F(x, 0), F,(t) este funcţia de repartiție empirică a obser- 
^ ^ e 

vatiilor t; si @ un estimator asimptotic eficient pentru 0. 


6.2. Repartiția limită a procesului empiric 7,(1) = 00020 — t} 


In censorizarea de tipul II la dreapta, in care sint cunoscute 
primele statistici de ordine a, x», ..., 2,, functia de verosimilitate 
a selecției n, $5, ..., 2, este 


= 
^ 


P(w, 0) = EAR Id E OLE IL (es 0). 


(n — r) ! ده‎ 


1 P - m ㆍ ㆍ رده‎ ㆍ v 
Dacă notăm cu @ estimatorul de verosimilitate maximă al para- 
metrului 6, atunci 


gar 0) P0. E Y a0) 
26, 1 —F(a,,6) 06, 


Putem serie 


A 2 kx o? ] 2 
(6.9) T 36 y 2 E UE 
09, Je = 20,00, Joe 


unde 


e 5 Kcu Cone NU (E P 
: 00600, - ) 


00, . 00, 


mE MRS 


: nd erue 965] 


Cu notatiile 
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(6.9) se “serie 


RAU 


(6.10) ۸0۵ — 0) = —K——— + & = Y, 1020 0) + و‎ 
P ۱ 
unde eq 0 si 


(6.11) 12, ( = 


” t 
ra 9) ۳ Ry Oat ae ae 
00 


Dacă lim = م2 > 0) و‎ > 1) si i, = F(x,, 6), atunci pt, — 0 


76 


p 
cu probabilitatea unu si limita I(x, 0) este definită de 


K 0. ME Lg 수 
( 


N 


OF (x, 9) 
20 


K 


[I — Fla,, 0)), 4 > £5 


unde F(x, 0) = p. 


OMA ۰ 
w^ ۱ 3 A c Tel 1 net 
Teorema 6.1., Dacă y(t) = lim y,(t) = lim Val F(t) — t], atune 


7 ]7)0([ = 0 pai 
și 
(6.12) eov [9(0, y(s)] = min (s, 1) — st — Hs) g(t) — 


- A'(t)g(s) + gls) Vg(t) 


unde 


(6.13) h(t) 
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Observaţie. Dacă T(r, 0) =K 2 In f(x, 9) 
c0 
Ky(t), 1 < p 
(6.137) h(t, 0) — 
Ky(t) Ie 6 
7(1) - |K o 0) t>p 
Lu ۲ 
şi (6.12) devine 


(6.12) eov[y (t), y(s)|=min(s; t) - st—9'(s) Kg (1), 0<s 


6.3. Repartiția asimptotică a statisticii „„W= 


T "nm 4 a 9 3 pps ㆍ 
Teorema 6.2. Repartitia asimptotică a statisticii 


b 
a Wi = M^ (t) Uc A? ai LUI E rat 
q 


q 


unde y(t) pi un proces Gaussian continuu de medie zero și covarianta 
dată de (6.12’) este aceeasi en a statisticii 


7 


[^ F : E A , N 

cu Zi Zs, ... variabile aleatoare independente N(0 1) si 0 LES 

> ex valorile nronri al Me: VERUS MT 1 > 
Wie - ovule proprii ale ecuatiei integrale 


b q 
^ pls, 0 fs) ds Aon p(s, t)[(s — s*?)(t — 12)]-12 f(s) ds = sa) 
q 5 


Propoziția 6.1. Dacă „W? — li fi hinel T 
í Ata ٩۰۰ Dacă ,,W?—lim,,W,, atunci cumulamtii sí 
dati de gi ico) 
$ 

Aio cm A = DIN e (t, t) di 

unde 
ESA A) i Hs, 4) e(u, t) du pentru j > 2 si 

GRY, a ۱ 1 Bs ازات‎ iA ip , 

£^" (s, 1) = pls, 1) (definită în (6.12’)). 
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atunci h(t, 0) — Kg(t), 


6.4. Verificarea normalitátii din date censorlzate, 
media si dispersia fiind necunoscute 


Pentru verificarea ipotezei eonform căreia selecţia dublu cen- 

sorizată de tipul I 
Ly < بو > و1‎ > 

CU 2 fiind constante cunoscute 
fixate provine dintr-o populaţie N (g, o} unde u si c? sint necunos- 
cuti, parcurgem următorii paşi : 

a) Găsim estimatorii de verosimilitate maximă ai parametrilor 
y si c?. În acest scop rezolvăm ecuaţiile 

CRP 0 ln P 
=a era - 0 


Qu 00 


1 € n -— 1 수 ra + 
و وک جح لاد‎ Xy = Moro و6 وج‎ Vy ȘI 


i 


unde 


n! t fre بل تب‎ 
Pa [o(5) A 0 (Er e e | si 
(s —1)!(n — r4 UAT 


x 
4 1 
=— و‎ + m .. yr. 
@(@) = es 가 AD | o(t) dt. Notăm soluțiile ecuațiilor ante- 
co 


"S ۳ A i2 ^ 
rioare prin u, respectiv o; 
b) Calculám 


e) Determinim valorile statisticilor Cramér-von Mises; 

d) Respingem ipoteza de normalitate dacă valorile găsite la 
punctul e) depásese cuantila corespunzătoare din tabelul 6.4 (res- 
pectiv din tabelul 6.5 în cazul selectiilor de volifm mic). 


Tabelul 6.4 


Cuantilele asimptotice ale statisticilor Cramér-von Mises pentru verificarea normalitatii 
cu date cenzorizate. 


A ^ AR DIN N PER SR i IRENE MES a RE 

| (52 Ex* oW? | gi py We | c? 

« | p=0,5 | و‎ = 0,75 |p = 0,9|p = 0,75|p = 0,85|p— 0,95|p = 0,5|p 

| | | | | | | | | 

0,50 | 0,017 | 0,035 | 0,045 | 0,019 | 0,0334 0,046 | 0,125 | 0,2024 0,268 
0,85 | 70.032: | 0,063 |0,082 | 0,037 | 0,061 | 0,083 | 0,219 | 0,349 | 0,456 
0,90 | 0,037 | 0,073 | 0,094 | 0, | 0.070 ۲۵,095 | 0,248 | 0,397 | 0,517 
0,95 | 0,046 | 0,089- | 0,114 | 0,055 | 0.087 | 0,116 | 0,297 | 0,480 | 0,623 
0,975| 0,054 0,105 | 0,135 | 0,066 | 0.104 | 0,138 | 0,346 | 0,563 | 0,729 
0,99 | 0,065 | 0,127 | 0.163 | 0,081 | 0,120 | 0,166 | 0,411 | 0,675 |-0,871 
Observaţie. Tabelul dă valorile lui w astfel încit P(co? < w) = &, 


unde 2 este statistica data. 
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Tabelul 6.5 


er ۳ tas e ro . ^ 9 
Cuantilele empirice ale statisticilor rW2 şi ¿Aj bazate pe 5000 de selecţii pentru n < 66 
$i pe 2000 de selecţii peniru n > 60. 


my H H iy 
(a) Cuantilele statisticii „WÈ 


aaa‏ ی 


punctul de 95% 


PC Tat - 0,9 n | رز‎ 70m | r=0,5n 
n SEU Niche. ARE aa E 
| V. M G | V.M. G | V.M. G 
| | | 
ا ا سس‎ — 
1 | 
20 | 0,092 0,100 | 0,071 0,078 | 0,043 0,048 
40 | 0,095 0,102 | 0,073 0,082 | 0,044 0,048 
60 | 0,095 0,101 | 0,073 0,081 | 0,044 0,048 
80 | 0,093 0,100 | 0,071 0,083 | 0,048 0,048 
100 | 0,095 0,100 | 0,073 0,082 | 0,047 0,047 
oo | 0,114 | 0,089 0,046 
| | 
pnunctul de 9095 
sued ne —— 
20 | 0,076 0,081 | 0,058 0,062 | 0,034 0,034 
40 | 0,078 0,083 | 0,060 0,065 | 0,035 0,035 
60 | 0,079 0,083 | 0,060 0,085 | 0,036 0,036 
80 | 0,078 0,084 | 0,060 0,058 | 0,033 0,036 
100 | 0,082 0,085 | 0,062 0,065 ۱ 0,038 0,037 
co | 0,094 | 0,073 0,037 
As 
(b) Cuantilele statisticii Aa 
۹ punctul de 95% 
ii ANES 3 
20 | 0,533 0,573. | 0,399 0,445 | 0.271 0,275 
40 | 0,560 0,572 | 0,419 0,461 | 0,289 0,286 
60 0,554 0,574 0,417 0,456 | 0,287 0,281 
80 | 0 0,570 | 0,412 0,408 | 0,310 0,288 
100 | 0,560 0,579. | 0,420 0,450. | 0,310 0,288 
00 | 0,623 | 0,480 | 0,297 
punctul de 90% 
WOES dl 7:34 - x 
20 0,439 0,463 | 0,331 | 0,208 
40 0,461 0,475. || 0,349 0,223 
60 | 0,466 0,477. | 0,346 | 0,226 
80 0,464 0,477 | 0,343 0,830 | 0,223 
100 0,478 0,483 | 0,354 0,368 | 0,231 
oo 1 
| 0,517 | 0,397 | 0,248 
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7. Verificarea exponentialitatii din datele censorizate cu ajutorul 
statisticilor Cramer-von Mises 


7.1. Introducere 


Cu ajutorul selecției censorizate de tipul 11 la dreapta în care 
sint cunoscute primele r statistici de ordine a, > e, < ...< a ne 
propunem să verifieam ipoteza conform căreia selecţia întreagă de 
volum a provine dintr-o populaţie exponențială cu funcţia de repar- 
titie 


Hom 91 3 erie 


unde 0 este ۰ 
În acest scop folosim statisticile 


A A 


iy ty 
QW, = ۱۱0 PANAS AJO 12 (7 — 8) at 
0 0 


A A A x 
unde t; = F(a,, 0), F,(t) este funcţia de repartiție empirică a varia- 
bilelor t, pentru > f, si 


^ 7 | 
= È ret (ai n« | pr 


ta} 


este un estimator eficient pentru 0. 

În eensorizarea de tipul I cînd un număr aleator de observaţii 
mai mari decit o anumită valoare x, este censorizată 0110 R obser- 
vatii cunoscute 


E Py <. HS 
cu R aleator, ipoteza H, este verificată cu ajutorul statisticilor 


p 


» f 
W2 n ۱ [ P(t) P t]? dt, A n 2 PAO 7 i}? (t 1st dt, 


A R | 
0 = ۳ xı + (n — R) H | n 
1=1 1 


^ 


fiind un estimator eficient pentru, 0 si, p. — F(x,, 0). 
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1.2. Repartiția asimptotică 


Teorema 7.1. Repartitia asimptotică a statisticii 


: 2 
W \ 230 dt (-4 = yo (f — E) ar) 
0 0 


unde z(t) este un proces Gaussian de medie 0 si 
cov iat), 2(s)} — his, t), = ۱ 


= min (s, t) — st — 71,1 — t) log (1 — t) (1 — 


2 p 1 
( s) log (1 — s) 
este aceeași cu a statisticii 
00 


y AJO, 


j=1 


cu Ci, Co, ... variabile aleatoare ¡independente repartizate y? (1) şi 
A, valori proprii ale ecuației integrale 


b 
Mte t) f(s) ds = f(t), O<t<p 
0 


(eem 


Punctele percentilice ale statisticilor , W? 81 و‎ 42 au fost obţinute 
aproximind repartitiile acestor statistici A. repartiţia statisticii 


[(s — s?)(t — t*)]-V?f(s) ds = ER 


K 
— y AWC; aC, , 


j=l 


unde K este numărul de valori proprii cunoscute, C 
sint variabile aleatoare independente repartizate ry 
Constantele a si v au fost alese astfel încît B si E * 43 
medie si aceeaşi dispersie. 


AD zd wm) 
Ys C, نج‎ xv). 
) să aibă aceeaşi 


Punctele percentilice sint date în tabelele 7. 1 si 7.2. 
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Tabelul 7.1 


Punctele percentiliee ale statisticii p 42 


| | | 
SEO | | | | | 
N | 0,5 0 | 0:7 | 0.8 | OF H 1.0 
8 as | | | | | 
punctele | | | | | 
> ~ | i | | | 
, “| | | i | 
ا ا ا س‎ 
1 | | | | 
50 | 0,201 | 0,244 0,293 | 0 | 0,407 0,496 
85 PEO ALA" 105404 0,583. | پا‎ 10,78 17015 
90 ۱ mA Dea 05687. "| 20 DOTA | 1,061 
95 5:05 622 | 0,746 | 05.920] 1 | 1,149 | 1,321 
97,5 | 0,763 | 0,914 | 1,062 | 1 | 1.394 | 1,590 
99 E aee A 1,324 t | 1,729 | > 1,917 
Pettitt. (1977) 
Tabelul 7.2 
^ 
Punctele percentilice ale statisticii p W? 
ES | 0,5 | Ody 028. 00814: 10:9 | 1,0 
punctele NS | | | | | 
oe | | [nw T | MEE 게토 Bie یل‎ E 
| | | | | | 
50 | 0,0247 | 0,0341 | 0,0442 1۰ 0,0548 | 0,0652 | 0,0738 
85 | 0,0531 | 0,0720 | 0,0921 | 0,1126 0,1321 | 0,1480 
90 | 0,0635 | 0,0857 | 0,1093 | 0,1333 | 0,1561 0,1745 
95 | 0,0821 | 0,1103 | 0,1401 | 0,1702 | 0,1986 0,2216 
97,5 | 0,1015 | 0,1359 | 0,1721 | 0,2087 | 0,2433 |: 0,2706 
9 0,1279 | 0,1710 | 0,2160 | 0,2613 | 0,3033 | 0,3376 


Pettitt (1977) 


9. Subprogram FORTRAN pentru testul Cramer-von Mises 


1. Plecind de la formula (1.6) am seris subprogramul funcție 
OMEGA pentru calculul valorii lui mol. 


| | FUNCTION OMEGA(X, N) 
| DIMENSION X(N) 

| OMEGA L./FLOA T(12 * N) 

DOE EY 

| X1 = (FLOAT (I) — 9.5) | FLOAT(N)—X(D 
| OMEGA — OMEGA + X1 x X1 

| RETURN 

| END 


X — vectorul statisticilor de ordine (real) 
N — dimensiunea vectorului X (întreg) 
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CAPITOLUL 7 


TESTUL WATSON (Us) 


1. Introducere 


În scopul verificării ipotezei nule Hy, conform căreia o selecţie 
de volum N avind funcţia de repartiție empirică F(x) provine dintr-o 
populaţie cu funcția de repartiție F(x), Watson (1961) consideră 
statistica 


+00 + oo 
(11) U% = x| (te) = F(x) 2 [Fu(y) — ry lar 01۳) 


deoarece, in contrast cu Wẹ pentru repartitiile pe cere, Ux este 
independentă de originea coordonatelor polare. 
Propoziția 1.1. (Watson (1961)). Avem 


(1.2) hit PG 9) => 2 £ (—1)”-! exp ( —2m?z?o). 
E m=1 


مهب ۷ 


2 


Deoarece repartiţia statisticii Ux este independentă de F(x), 
putem presupune că selecţia provine dintr-o populaţie uniformă pe 
[0,1]. În acest caz are loc 

Propoziția 1.2. (Watson (1961)) 

= Fe) 43 1 
1.3 UX = Li -- 0 +- A+ 
ed: dear dy AN 


t=1 


unde 
ULA مک و‎ fa Goa « l. 

În cazul general, cînd F(x) este arbitrară, y = F(a) este reparti - 
zatá uniform pe (0,1). Astfel UX este calculată folosind valorile 
ordonate ale lui y; dacă v; sînt ordonate, de asemenea vor fi ordonate 
si cantităţile y; = F(a) si Ux este calculată din (1.3) cu a, înlocuit 
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세 


prin Y; Din (1.3) urmează că valoarea minimă a lui Ux este 1/(12 N) 
cind 


a, — (2i — 1(2 N) 


= 1 : : : SEE LES 
( deoarece cc ES este media aritmeticá a acestor cantităţi). Valoarea, 


maximă a lui U} este N/12 şi este atinsă, fie cînd toti x, sint aceiaşi, 
fie cînd sint împărţiţi arbitrar în două grupe, în 0 si in 1. 


2. Funcţia de repartiție. Puncte percentilice 


Avem 


Propoziția 2.1 (Stephens (1963)). Functiile de repartiție (Py(2)= 
= P(U% < 2)) exacte ale statisticilor U3 si U} sînt 


1 
P,(2) E 0 d LANE 
24 
L 1 1 
(2.1) paa ko o3 a 
i jp 19/794 Pte 
1 
Pate) d qu ae FB 
6 
şi, respectiv, 
ipso QE 그 
: C 1 1 1 
P,(z) =.2/3r [4 2. eu c Lh 
36) 36 12 
ES i 1 — 1/2 
(2.0) IPS = 9/3z|e ——) — 6/3 [2 — lare tg V 18[2 EE Y 
36 36 19 
= 1\2 34 1 
+ f: | E <a. 
\ 12 12 A 
) 1 
Pa(z) =l ^: «2 


Propoziția 2.2 
a statisticii U 


P,(z) 


2.3) t 
2 


22 (Stephens (1964)). Funcţia de repartiție 02000 
4 este 
= 0, ی‎ 
48 
16 x EI. 1 5 
j | y COM a hu 
Abe. 18 96 
3 yg E A: 
= —16z|2 — — + 6 | ۵2| 2 - ㅣ em: 
48 8j 8 y2 
£4. 7 Lila 5 1 
$. (2) (notație), vede wee 
96 12 


—f,(2) (notație), RIE: 
12 48 


7 1 
ee: ED etc 루 
48 3 
1 
EL, EE 
3 
Tabelul 2.1. dă punctele percentilice ale statisticilor UZ, U? si U2. 
Propoziția 2.3 (Stephens (1963)). Momentele statisticii U}, sînt 
1 
Te 
Lal Ü NJ >> 19 
eS 


[ 
(2.4) | 3 
[ 
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360 N 1 

2) UN — DG N — 3) 
1560 N2 

i AN 1) (19 N* —51N 

302400 N3 


+ 36) 


Tabelul 


2.4. 


J J2 


2 ۳2 ds 
Punctele percentilice ale statisticilor Us, U3 si Uy 


가주 de Coada inferioară Coada superioară 
EY | 7 1 > 
semnificatie | q | E | 2 M | E 4 
%) | Uz Ue aes ao Date ele ata 03 
EN 0x Xy 509 NE سکس‎ ce کی شهار‎ A A A با‎ 
1 | | 
01 0,04166 0,0279 | 0,02156| 0,1664 0,238 | 0,2840 
055 | 0,04167 0,0282 0,02298| 0,1654 0,224.) 10,2516 
1,0 | 0,04168 0,0287 0,02424| 0,1642 0,213 0,2327 
2,0 | 0,04172 | -0,0296 | 0,02624| 0,1617 | 0,199 | 0,2104 
2,5 | 0,04174 0,0301 0,02711| 0,1605 0,194 | 0,2024 
3,0 | 0,04178 0,0305 0,02792| 0,1593 | 0,189 | 0,1956 
„0 | 0,04187 0,0315 0,02942| 0,1569 0,180 0,1845 
5,0 | 0,04198 | 0,0324 | 0,03080| 0,1545 | 0,173 | '0,1755 
5,0 | 0,0421 0,0333 0,03209| 0,1521 0,107. ^ 10,1679 
UU 0,0423 0,0342 0,03330| 0,1498 0,161 | 0,1613 
10,0 | 0,0429 0,0370 0,03665| 0,1429 | 0,147 | 0,1460 
15,0 | 0,0445 0,0416 0,0416 0,1320 | 0,129 | 0,1288 
20,0 0,0467 0,0462 0,0459 0. 1217 0115-4 = 
30,0 | 0,0529 0,0553 ye 0,1029 | 0,096 | ES 
40,0 0,0617 0,0645 | 0,0867 | 0,0829 | — 
50,0 0,0729 0,0737 -— — — | e 


Steptens (1963) Stephens (1964) 


Propoziția 2.4 (Stephens (1963)). Avem 


از 


r Ls (N +1) 
(2.5) 해 pem 
12 7 7 197 2 
Cu notatiile 
(2.6) و‎ xy (: — sb SS Rt 
12 N 
unde 
sec a =/2 NR (e) 
avem 


) 9 
1 

N? 

(sino 00, 
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Propoziția 2.5 (Stephens (1964)). Pentru orice N, coada in ferioará 


a repartitier statistieii Ul este 
۸ [ N 


1 
Pu(2) = 0, 2 
12 N 
P (2) GN — 1 ) YN Vx R(g)*-» 1 T 1 ۱ 1 
x 20 +1) 12 ۸۷ ^" ^12N | 2X? 
) 
(2.7) و‎ ۱ i 
Pyle) = (N — 3) ! YN {Vr ROI Jia. Im 
r Pi E )) 
92 
E. NI (e) | a A: a os Ec 
erly LINE TINS — 199. «e 
dT 


Tabelul 2.2 dá punctele percentilice (în coada inferioară) pentru 
statistica UX pentru diferiţi ۰ 
Tabelul 2.2. 


Punctele percentilice (în coada inferioară) pentru 
statistiea.U?. pentru diferiţi N. 


Pragul 
de sem- ; 2 5 
nificatie a 8 ۳ i » 
96) 
| 
0,1 0,01860 | 0,01723 | 0,01667 | 0,0162 
0,5 0,02101 | 0,02025 | 0,01998 | 
1,0 0,02281 | 0,02229 | 0,0220 | 
2,0 | 0,02536 | 0,02497 | | 
2,5 0,02638 | 0,02600 | | 
3,0 0,02731 | 0,02692 
4,0 0,02896 | | 
5.0 0,03041 | | 
6.0 0,03172 | | 
7,0 0,03292 i 
10,0 0,03610 | i 


Stephens (1963) 


Tabelul 2.3 dă punctele de semnificaţie inferioare si superioare 
pentru diferite valori ale lui N si arată convergenta la punctele de 


semnificaţie date de repartiţia asimptotică (calculate cu ajutorul. 


propoziției 1.1.). 
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Tabelul 2.3 


Punetele de semnificaţie ale statistieii U5 


a renner ne 


| Coada inferioară 
Pragul de | 5 


semnifi- | Volumul selectiei, N 
catie | qud ds TS 1 3 
(%) 2 ۱3 4 09 5 6 10* 00 
| | 
0,1 0,04166 [0,0279/0,0216/0,0186/0,0172/0,0153|0,0142 
0.5 | 0,04167 [0,0282/0,0230/0,0210/0,0203|/0,0195/0,0176 


1,07 0,04168 |0,0286/0,0242/0,0228]0,0223/0,0215]0,0197 
2,5 0,04174 |10,0301/0,0271/0,0264/0,0260 0,0250/0,0234 


5,0 0,04198 |0,0324/0,0308|0 ,0304 0,0286/0,0274 
10,0 0,0429 |0,0370/0,0367/0,0361 0,0339/0,0331 
15,0 | 0,0445 ¡0,0416/0,0416 j0,0387/0.0378 


i 


Coada superioará 


Pragul de |———————— TCR cede م‎ 
semni- Volumul selecţiei, N 
ficatie F 고 rid 0 
(96) 2 | 3 | 10% 00 
3 PT | 
1 
0,1 0,1664 0,238 0,350 0,385 
0,5 0,1654 0,224 0,282 0,304 
1,0 0,1642 0,213 0,251 0,268 
2,5 0,1605 0,194 0,212 0,222 
5,0 0,1545 0,173 0,181 0,187 
10,0 0,1429 0,147 0,150 0,152 
15,0 0,1320 0,129 0,131 0,131 


Stephens (1963) 
* Valorile pentru US sint obtinute in urma unui studiu Monte Carlo. 


Tabelul 2.4 se foloseşte în felul următor. Pentru o mulţime de N 
valori date, se calculează Uy după (1.3). Dacă în tabelul 2.4, în linia 
corespunzătoare lui N, Ux depăşeşte valoarea lui 2, ipoteza nulă 
Hg (conform căreia cele n observaţii sint făcute asupra variabilei 
aleatoare cu funcţia de repartiție F(z)) este respinsă la pragul de 
semnificaţie corespunzător. Aceasta presupune folosirea unui test 
unilateral avind alternativa unei ajustări defectuoase. 

În cazul folosirii cozii inferioare se respinge H, dacă U? este 
mic. 

Tiku (1965) presupune că 


(2.8) Ux(dat de (1.1)) ~a +b 2300, 


unde a, b si f sint determinaţi astfel încît Uj si a + b y*(f) să aibă 
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aceleaşi prime 3 momente. Găsim 


Tabelul 2.4 


Punctele percentilice pentru d în coada superioară. 
Pentru volumul selecţiei N, tabelul dă z astiel încit P(Uy>z) = 
unde 100% este pragul de semnificatie ۰ 


| Pragul de semnificație (%) 1 
7 | | | 
" 10 | 5 2,9 | 1 | 0,5 
| | | | | 
2 [0,143 [0,135 | 0,1601 | 0,164 0,165 
3 105447 — |'0;:173. | 0,194. | 0,213. , 170,224 
4 |0,146 10,176 | 0,202 | 0,233 0,252 
5 0,148 | 0,177 | 0,205 | 0,238 | 2 
6 0,149 | 0,179 | 0,208 | 0,243 | 0,269 
7 0,149 | 0,180 [0,210 | 0,247 | 0,274 
8 0,150 | 0,181 0,211 10,250 | 0,278 
9 1054500 01.0 1821: |.0,212 | 0,252 0,281 
10 | 0,150 | 0,182 | 0,213 0,254 | 0,283 
| | 
12 0.150 | 03086" 10,215 .. | 0,256 0,287 
14 10,151 | 05184" | 0,216 0,258 0,290 
16 0,151 0,184 ^ | 0,216 | 0,259 0,291 
18 0:151... 0,184 10247, 55 05280 0,292 
20 | 0,151. | 0,185 | 0,217 | 0,261 || 0,295 
| | | | 
25 0,151 | 0,185 | 0,218 10,262 | 0,295 
30 0,152 | 0,185 -| 0,219 | 0,263 0,296 
40 | ۵,152 | 0,186 | 0,219 0,264 | 0,298 
50 0,152 | 0,186 . | 0,220 0,265 0,299 
100 0,152 | 0,186 | 0,221 0,266 0,301 
oo* 0,152 | 0,187 | 0,221 1 0,207 0,302 


* Valorile. aproximative cu N = 1000 concordá cu aceste valori 


asimptotice. 

Stephens (1964) 
Aproximatia (2.8) nu poate reproduce valorile lui UM mai mici decit 
a, în timp ce valoarea minimă adevărată este 1/(12 N). \ alorile Tui 
a 81 f pentru un număr de valori ale lui N sînt date în tabelul 2.5. 
Pentru a înţelege mai bine aproximatia s-au calculat valorile lui Ba 
pentru repartitiile adevărată și aproximativă, 
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Pentru N < 
Valorile «-punctelor percentilice superioare (0,5 > «> 0,001) au 


lost 


obtinute din aproximatia (2 


Ke 


Tabelul 2.5 


6, diferențele valorilor lui 8, sint considerabile. 


3), folosind tabelul 2 al lui Harter 


Valorile lui £, pentru repartitiile adevărată si aproximativă. 


Valorile lui By 


N f 

4 [| 4,7040 

Vp oră 

6 | 3,6296 
10| 3,0519 
20 | 2 
A 2,5848 
00 | 2,45 


0,0133 
0,0167 
0,0185 
0,0216 
0,0234 
0,0244 
0,0250 


a 


IID 
و‎ JA ow 
Crete 


| 
| Pentru y ? | Adevárate | 


Diferenta 


| 
| 4,86 | 0,69 
| 5,49- | 0,51 
| 5,91 | 0,41 
| 49 | 00 
| .7,46 | —0,05 
O has de 
RA 7 20 .24 
Tiku (1965) 


1964). Aceste valori au fost comparate cu acelea obţinute de Step- 
hens (1964) (tabelul 2.4). Pentru N > 4, aproximatia (2.8) în care 
primele 3 momente coincid, dă valori care diferă în general, de apro- 
ximatia lui Stephens în care primele 4 momente coincid prin x < 0,001- 


Tabelul; 2.6 


Compararea valorilor a — punetelor percentilice inferioare ale statisticii U2 
| 0 
0,5 0,1 | 0,05. | 0,025 0,01 
| Li 
| ] 
| Aprox. (2.8) | 0,0726] 0,0344 | 0,0285 | 0,0248 | 0,0217 
N= 5 | | 
Exacte | * | 0,0361 | 0,0304 | 0,0264 | 0,0228 
| i | | 
| Aprox. (2.8) | 0,0705 | 0,0339 | 0,0291 | 0,0262 | 0,0241 
N = 10 
1 Monte Carlo | 0,0706 | 0,0339 | 0,0286 | 0,0250 | 0,0215 
| | | 
Aprox. (2.8) | 0,0685 | 0,0336 | 0,0297 | 0,0276 m 
| I 
۷ — 00 | | f 
Asimptotic | 0,069 | 0,0331 | 0,0274 | 0,0234 b. 
Tiku (19 65) 
* Stephens (1964) nu calculează valorile pentru « = 0,5. 
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3. Relaţia dintre repartitiile limită (N—00) ale statisticilor Wy si Ux 


Funcţia caracteristică a statisticii WE, este 


1 
00 PATA ar yi 
(3.1) vy w= (: e ۱ 
"o fai jer? 
dînd cumulantii 
(s—1)! 2 1 


sau, cu ajutorul numerelor lui Bernoulli, 
(s — 1)! 
Functia caracteristică a statisticii U3, este 


(3.2) وچ‎ (0 = HH E EAE J^ 


27272 


K AWZ) = 2-2. 


Prin urmare am demonstrat 
Propoziția 3.1 (Pearson, Stephens (1962)). Avem 


2 
(00) = E 2 | | id X,(U3) P = K, OV). 


“Ww 4 92s-1 


Observaţie. Din (3.2) se poate vedea că repartiţia limita (N — oo) 
a statisticii Uz este ca a statisticii 


08 S 
وز )27797( از‎ 


jal 


unde o, sint variabile aleatoare independente, fiecare avind o repar- 
titie exponențială de densitate 


po,(9) pero v0. 


Corolarul 3.1. Primii 4 cumulanti ai statisticii Wy, sînt: 


8 8 
yid mmc M I SL, Wi 
6 45 945 1575 


iar ai statisticii U2, : 


| a 13 
Ae Banting AS M ca 
12 360 3780 75600 
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si deci rapoartele cumulantilor au valorile 


| Woo Uz 
| 
B, = KFS 6,531 | 3,265 
| 
li 
SR aga 10,286 | 5,143 
| 


| 


) 
P 


Y : 2 csv fl e Mt 
Dacă punem v = F(z), Ry = Nd? = N | — — v| si dacă ţinem 


seama în (1.3) de (6.1.5), obţinem : 


Wy = Un + Ry 
Deoarece 
oN — 3 AN 3, N—1 
DR E= aci MM EE IU Ho J3 U2) = : 
A Tage Se FREON (US) = 360 N 


D?( Wi) = DAU + 28028) + 2 cov (UF, Ri), 
are. loc 
Propozitia 3.2 (Pearson (1963)). 


{ 
|. N=10 N = 00 
| | 
D : hele | 
(Wi, Uh) = al | 0,697 0,707 
¡Ade 4 —3 | 
(3N — 2) y3 | 
QWL, A ELI a x 0,950 | 0,949 
aa e V (4N —3) (5N — 3) | 
N—1 | | 
a CENTE 0,438 0 
0003, RR) = y UNO | "AMT 


T C 2 
4. Componentele statisticii U? = "Nro —g | (042) da 


Stephens (1974) consideră dezvoltarea, 
m D N ㆍ 
(4.1) UP ره + وم"‎ ( 
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unde A 
I RES God 

^ O) ME 1 i a es I میم‎ A5 

(4.2) AAN ب2‎ sin T 2; 


iar Y * arată că suma se face numai după indicii pari. 
Prin urmare 


€) oo 
T2 os ~ FAR) 
e BU 
cu 
n 
: 9 18 eT : ide : : 
(4.3) Ri = B+ Dy gO Ty = Y; sin ) x 4). 
i=l 


Punctele de semnificație ale statisticii R, au fost date de Greenwood, 
Durand (1955). 


Pentru valori mari ale lui 7, 2,, este bine aproximat de o varia- 


bila N(0,1) si 2R5/n de o variabilă y?, adică u — R3/n-are functia 


de repartiție 
Ba) le oca 


Astfel, pentru a obţine un test bazat pe componenta de ordin j æ 
lui U? se pot calcula valorile R, si ne vom referi la ele ca la Rg. 
Asimptotie, 25, w~ N(y'SF, 1), unde 67 are componenta i(i = 1, 2) 


1 
(4.4) oo [25 jf cos (gelga 3 42:9. ur. 
0 


Atunci 210/0 = 23 +2? are asimptotic o repartiție y?(2, 24) cu 


2 > 


(4.5). 24 = (y 07)” + (167)? = (7191 + 339,9)? + (395 + 1202)". 


În iporeza nulă, U? are momentele 
Ug = 0,08333, 03 = 0,002777 si Say = 0,000265. 


/ 


Cu Qf = (y'57)? = (1,8% + 7.88)? în ipoteza alternativă H, avem 
u = M( U0?) = po + » (9; 

j 
= of + Y (0, + 0%)/(jin?), 


As = Hoy + Y. (9, + 97)/ (9925). 


Fi 


Q7)/(*77), 


(4.6) 0 
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35, = 0 pentru j impar si 3£ — 0 pentru j par. Astfel 


340% = 0 pentru toti j. 


97 


. Ortogonalitatea simplifică, de asemenea, parametrul de necen- 
tricitate pentru R; ; (4.5) devine 


(4.7) dy = 4D وا‎ 


Cu notatiile 


0? 82 82 

Es ji 1 ji ^ ji 

By ht ey A Badr e ele 

1.8) J ETE j g mă j 676 

۳ :J 

se e 32 D 8ta 

HEN A PODEMOS SUBE UE ME. 
3 2 Si oy. 4 4 7 3i - :6 6 

aos cas 401] 76 7 de 


unde ی(‎ indică suma numai după valorile pare ale lui j, relaţiile (4.6) 
devin 


B= po + YBa + BR) + A Bros + BR), 
f M) 9 2 © 1 g ۱ 
(49) 10۶ = of + 407 By + BE) + (By + Bi), 


5. Studii privind puterea. Test pentru normalitate 


Stephens (1974) face studii asupra puterii testelor bazate pe 
W?, U? şi A? cind ipoteza nulă este N(0,1) şi ipoteza alternativă este 


Nr/Vn, زو دا‎ val m). 


Aceste studii folosesc coeficienţii 3;;. 


Puterea asimptotică a componentei S; a lui W? poate fi găsită 
folosind faptul că, asimptotic, 2,; ~ N(p, 1), unde y = y'6, = 
F و۷‎ 
.. Puterea componentei R, a lui U? poate fi găsită folosind repar- 
tifla necentratá y?(2). 


INI 
A | 
۲۱۵۸1 1 


Pentru statisticile W?, U? şi A? complete, din (5.5.23) şi (4.9) 


au fost obținuți cumulantii pentru repartitiile din ipoteza nenulă si 
au fost folosiți pentru a ajusta repartiţia aproximativa de forma 


a bx2(p), 
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cu constantele a, b, p determinate astfel încît primii trei cumulanti 
să aibă valorile adevărate. Pentru componente au fost considerate 
numai teste bilaterale, iar pentru statisticile întregi numai teste 
unilaterale. 

Cu această aproximaţie, Stephens (1974) reface tabelul 6.5.4.* 
gi găseşte pentru A”, deplasarea dispersiei, cu ys = 2,77 şi 5,095 
(y, = 0), valorile 0,15 si respectiv 0,22 (în loc de 0,401 și respectiv 
0,889). 

Pentru a lămuri aceasta discrepantá, Stephens (1974) face un 
studiu Monte Carlo al puterii. Consideră 1000 selecții de volum 
100 pentru y, = 2,77 şi 4300 selecţii de volum 100 pentru y, = 5,095 
Deoarece extrapoleazá de la o selecţie de volum n = 100 la n — oo, 
dă rezultate Monte Carlo si pentru W? si U2. Tabelul 5.1 dă proporţia 
din selecţie declarată semnificativă printr-un test cu pragul de sem- 
nificatie de 0,05. 


Tabelul 5.1 
Proportia dim selecție declarată semnificativă pentru testele W*, U? si A? 0۷ 6 0 ۶ 


ven | 해 jd‏ کی رم 


| 
Ya = 2,77 Teoretic | | 0,09 | 0,25 0,15 
Monte Carlo | 100 0,10 | 0,21 0,17 
| | 
Y; = 5,095 Teoretic f | 0,26 0272 0,52 
Monte Carlo | 100 | 0.20 0.52 0,46 


Aceste rezultate sugerează că valorile obţinute de Durbin, Knott 
pentru A? nu sint corecte. 


6. Contururi ale puterii 


Metodele grafice oferă un mod efectiv de comparare a abilității 
statisticilor în detectarea combinațiilor de schimbări în medie si 
dispersie. În figurile 7.1 şi 7.2 valorile lui vi, Şi 73, ce reprezintă schim- 
bările în medie si مرت‎ în dispersie sint înregistrate pe axa «-lor 
si pe axa y-lor. Pe grafice au fost trasate liniile de putere constantă. 

În figura 7.2, liniile de putere constantă sint trasate pentru 
A2, W2 şi U2. Pentru A? este arătată mulţimea completă, însă pentru 
W?( U?) numai liniile de putere constantă de 40% (80%). 

Pentru comparaţie cu tabelul 6.5.4 notăm că cele 4 coloane din 
tabel corespund punctelor de pe grafic cu coordonatele (yj, y2) egale 

u (3,84; 0), (13,00; 0), (0; 17,67), (0; 25,96). 


* se citește tabelul 5.4 din capitolul 6. 
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Discutia graficelor 


a) O statistică va fi mai puternică decît alta dacă linia sa de 
putere constantă este mai aproape de origine. 


Y | X 80 cu pante mici : U* E 
— س‎ —— prima componentă a iui U^ 
Numerele dau puterea (%) 


۱ 32 
wi = 
8D) he 
24; 
ord 
160) 16 
Wi نج‎ 
(40) gt 
ws — فک بح‎ 
0 و‎ 
ML ev ce ce TA LIES ~~ 
/ AE A f$ 1 
we owe wè wi 2 ? 
(20) {40}  (60j (80) 11 
Fig. 1 
0 —— A 


— — — — WO si 80) si UXO si 80) 
Numerele dau puterea (*,) 


Kis 2 

Y ~ (80) ۷ 
40) \ N = 

Y era PAS 

i yea ys. Y PSU 
TUE T RO RIS MI EO NE DE LS 
420 40. yt p y? 
Li 
Fiz, 7.2 


217 


Astfel putem vedea că in această situaţie, pentru es 
ipotezei N (0,1) fatá de o alternativá normalá, A* este mai puternie 
백스 MAR U? devine mai bun decit A? în cazul alternativelor de 
deplasare a dispersiei. x 

Un mod interesant de a face comparații este de a esloula 해체 
cuprinsă între o linie de putere constantă si axe, pentru o statistică 


Tabelul 6.1 


Compararea liniilor de putere constantă pentru testele 
W?, U? si A? Tahelul infátiseazá aria aproximativă eu- 
prinsă între linia de putere constantă şi cele două axe. 


س ل me‏ 


| | 
Linia | | | 개 
de putere | 20% | 40% | 60% 80% 
5 | 
constantă | | | 
| | 
| | | "e 
we | 15 N MS dad 316 
U2 11 51 177 130 300 
۱ | a 34 77 172 
BED DIM 62 162 


dată si o putere dată. Aceasta nu intotdeauna, deoarece depinde de 
parametrii axelor, însă, cum alegerea yi, y2 dá linii de putere Conta 
ce sint aproape linii drepte, aceste arii au fost calculate si imber 
tabelul 6.1. (Stephens (1974)). Acest tabel aratá superioritatea sta 
hs rac a, E de componente, ştim că componenta dé ipa 
j رم‎ a statisticii W*?, va avea linia de putere constantă por IÓ 
axă, y-lor pentru j impar si cu axa z-lor pentru j par. Beza Ale 
asemănătoare au loc pentru componentele statisticii A*, ا‎ py : 
pentru primele două componente, 1 La 4: sint arătate în figurile 7 
si 7.2. Liniile de putere constantă pentru Wi si 4j taie axa 20 


aproape in aceleaşi puncte ca acelea ale statisticilor întregi, însă 
A&P OA i « AR 4 E $1 2a : - 
cînd y? crește, ele se deplasează paralel cu axa yg în timp ce ak a 
T ie if : ۳ ă 51 fo y AVAS iei tio f. ۱۹۹11 1 
W? se deplasează către axă. Astfel nu vom avea nici un cîştig folo ind 
prima componentă decit întreaga statistică. A doua componentă 
pentru W2(:42) este. mai bună decit statistica întreagă pentru depla- 
pentri 2(42) este mal Û 

sări mici în medie. bei y E pie 
Măsura ariei pentru aceste componente este infinita, retlectind 
insensibilitatea totalá la un parametru. O ua a 
i 6) Prima componenta a lui U? are proprietăţi mult mai bune E 
lin “sale de putere constantá din (4.7) sint linii drepte de la 0 axa 
311 DADO UY و‎ " A A wis Pee jm 4 a Pie 1 5 
la alta si este la fel de puternică ca însăşi U?. Măsurile ariilor sint date 
a ALLA $ D > ic i > ú 

în tabelul 6.1. 
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În situaţia generală de ajustare, dorim ca testul să fie sensibil ; 
dacă, se verifică ipoteza N(0,1) faţă de alternativa N(u, a?) dorim 
ca Statistica test sá fie sensibilă atit la schimbarea lui u eit si a lui 
c”. In această situație cea mai bună statistică este 2 


1. Studiul puterii. Test pentru exponentialitate 


Comparatiile de mai inainte pot fi extinse pentru a verifica expo- 
nentialitatea, unde ipoteza nulá este 


Hy: F(y) = 1 — exp (—0y) cu 6 = 1, 

31 

H ,: familia exponențială rămasă cu 0 = 1-4 al n. Teoria puterii 
urmează un drum similar eu cel pentru normalita 
parametru y, care dă o singură funcție 

g(«)— — (1 — x) In(1 — 7) : 

atunci găsim 3, si 37. Mediile componentelor si cumulantii stati 
cilor intregi sint date ca pentru cazul normal, însă numai cu o com- 
ponentá in 3, si 3f. Studiile privind puterea sint sintetizate în 
tig. 7.3 si in tabelul 7.1. În această figurá puterile sint. comparate 
direct, deoarece avem numai un parametru. 
a Tabelul 7.1 


ate. Avem un singur 


SUl- 


Test pentru exponentialitate. Valorile 
lui Y3 ce dau puterea P(%) pentru A?, W2 
şi U? şi pentru primele lor componente. 
Statis- | | | 
Statis- | +, | 
" P(%)| 40 8 
tica \ (o | | Pe 


| 


an 3, 60 9,7 
Al | 3,9 10,2 
W2 | 4,0 | 10,7 
; wi | 2 | 11,2 
t | 8,6 | 20,6 
Ui | 9,5 | 23,9 


7.8 "Test pentru exponentialitate : 
W?, Uê, A*. 

Observaţii. Si in acest caz A? este cea mai bună statistică; ur- 

mează apoi W*, U? fiind relativ slabă. Pentru cele trei statistici, 

primele componente sint aproape la fel de eficiente ca intreas 


ga, sta- 
tistica, însă, pentru a doua componentă, rezultatele sint considerabil 
mai slabe. 


Rezultatele combinate sugerează că luînd o componentă în 
locul statisticii mtregi obţinem un cistig foarte mic în cazul unei 


alternative generale. 
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)8. Statistica U5 pentru repartitii multinomiale P,(M%,, Mo, + -, Mz 
(1.2.1) complet specificate 


Definitia 8.1. Statistica Ux pentru repartitii discrete este defi- 
nità de 


(8.1) U2, AUN [x Ys is (X: 8. i) L i k 1 
' | 


j=l j=1 


J 
(8.2) B, — Y (n/N —p), ژ‎ = Look. 
i=l 


Teorema 8.1. Dacă vectorul x are componentele 
x, —oIN — ppt =M Ts HEM 
atunci, asimptotic, x ~N (0, E) unde 
(8.3) ou = ne — p)/N 8 oy = —MP IN (i. 3 f= او .: و1‎ — 1) 
Cu acestea U% poate fi scrisă ca următoarea forma pátraticá în x. 
(8.4) UY = MA” Axi 


unde A este matricea avind elementul ¿ de pe diagonalá egal cu 

i(n — i)k si elementul (i,j) egal cu 

(8.5  min(i, j) [k—max(i, j)/b ) 235 وه‎ j =1, n k =1) 
Teorema 8.2. Asimptotic, US este repartizată ca o sumă pon- 

deraiă de k—1 variabile aleatoare ~ y? (1). Ponderile atasate variabilelor 

x2 individuale sînt date de valorile proprii ale matricii NE Afk al 

cărei element (+, j) este 


Pi A977. 세 일 ite dest 3 j 
za fix — max(i, j)]min (4,3) pé p.[n — max(7, j)] min(^, j i}. 
(8.6) 


Pentru a găsi repartiţia asimptotică a statisticii Uy într-un caz 
particular procedăm după cum urmează : 

I. caleulám matricea definită de (8.6) si valorile proprii 
«(i =1, ...,k — 1) ale sale. 

II. determinăm in funcţie de œ; primele patru momente ۵ 
de medie ale repartitiei asimptotice a lui ۰ 


2 3 
ui THe bs NI 2 Y ود وه‎ = 8 y و‎ 
ua = 48 Y of + 12( Y; o7. 


1 
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III. folosind aceste momente repartiţia poate fi 
de curbele lui Aia 
În tabelul 8.1 se dau valorile proprii به‎ si valorile ic ilie ta 
ale copiata هر ده‎ Urs bd VB, = ولا‎ pa Bi B. = = ualuă pentru repar- 
titia multinomială uniformă p, = 1/ Ne i= 2, Bs 4, 5, 6, 12, co. 
à ; ; 6, 12, 00. 
Pentru comparaţie pe ultima linie a tabeldini se dau valorile 
CS ale momentelor repartitiel asimptotice a statisticii 
y pentru repartitii continui (Stephens (1964)). 


aproximată, 


Tabelul 8.1 


} 
A Valorile proprii «; | TE | | 
| TI ee ORT: Po pa | Va S One (ae IO 
| | | | 
2. | A6 | 505 | 
hy m 0,0625 | 7,813 2,83 15,00 
asi] Cer: | 0,0741 | 5,487 2,00 | 9,00 
îi tie ۳ ۳ 0,0781 | 5 1,78 7,89 
: | vo —)5,5 +75,5-+)5)/250 | 0,0800 | 3,840 1,737 200 
5 GA 12,12) /432 | 0,0810 | 3,526 | 1.71 | 6 
12 2 (2 —/3),12(2 —V3),4,4,6,6, | 
| 12,12,12(2+/3 31283 V3))/1728 | 0,0828 |. 2,969 1576 -] 7194 
00 | | 33 | 2778 | 18 E 
| 0,0833 | 2,778 1951; 07 8. 14. 


9. Subprogram FORTRAN privind statistica Watson 


2 Eye 249 tietias Pata F 1 E 
E t Pentru Statistica Watson am folosit formula (1.3) pentru 
scrierea subprogramului functie UN PT. 


|| PUNCTION UNPT(X,N) 
DE. MENSION X(N) 
= Q. 


Fă LS se BE 
| DO 1 I-1,N 
1 || X1- 11 + AX) 
11" X1 = —XI/FLOAT(N) + 0.5 


UN PI = 1. | F.LOA T(12» N) 
IL ID DT S [QUE 


aes Xa) + Al — (FLOAT(I)—@.5)/FLOAT(N 


2 | UNPT = UNPT + X2« 9 
|| RETORN 
| END 
unde t 


X — vector al statisticilor de ordine (real) 
N. — dimensiunea vectorului X (întreg). 
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CAPITOLUL 8 


TESTUL KUIPER(V,) 


1, Statistica Vy şi repartiţia sa 


Kuiper (1960) propune statistica Vy, o adaptare a statisticii 
Kolmogorov, pentru a verifica ipoteza nulă conform căreia o selecţie 
de volum N provine dintr-o populaţie cu funcţia de repartiție E(x) 
continua. 

Definiţia 1.1. Dacă F(x) este funcția de repartitie empirică, 


(1.1) Vy— sup (Fy(x)—.F(z)-— inf (Fyle) — F(%)). 
—00 > <O — 00 > <00 

Propoziția 1.1 (Kuiper (1960)). a) În ipoteza nulă, repartitia 
statisticii V este CR دوز‎ de F(z), b) Dacă observațiile sint puncte 
pe cere, valoarea lui V y definită de (1.1) nu depinde de alegerea originii 
de măsurare a lmi 20. 

Observaţie. Statistica Kolmogorov nu are proprietatea b). Prin 
urmare, V, este foarte utilă pentru observaţiile pe cere. 

Teorema 1.1 (Kuiper (1960)). Pentru valori mari ale lui N, 

PY N Vy>2) = X 2 (Ami 1) ‘er? 


m? (&m?2? —3) 6- 4-0 (= 


e Mt +) 


Observaţie. O aproximaţie rezonabilă a probabilității din teorema 
6 
primii termeni ai seriei de mai jos pentru 2 > —. 


) 
J 


1.1. se obtine 


(1.2) 2(422 — 1) e-?^ 4 


Kuiper (1960) da tabelul 1.1. . 
Stephens (1965) determină repartiţia exactă a statisticii Vy 
atit în coada superioară cit si în coada inferioară. 
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Tabelul 1.1 


v=P(Vy > z/ V10) 
e e ii PR E SIRNA S 


* | uid y10 lo = P(V y> 21/10) 
| 
| | 
1,0. 5.3 0,316 | 0,693 
1 | 0,348 | 0,528 
2 | 0,379 | 0,377 
123 | 0,411 | 0,252 
1,4 | 0,443 | 0,158 
1.5 | 0,474 | 0,093 
1 „6 | 0,506 | 0,052 
1,7 | 0,536 | 0,027 
1,8 | 0,569 | 0,0135 
1,9 | 0,600 | 0,0063 


Au loc teoremele : 

Teorema 1.2 (Stephens (1965 JM "T 
¡A و‎ (Stephens (1965)). Repartiția statisticii Vy, coada 
superioara. ۱ 

a) Fie 


1 
2 — dacă N este par sau 2 I. 1J(9N sN . 
2> 3 dacă N este par sau 2 > (N —1)/(2N) dacă N este impar 


p 
b) Fie M = [N (1 — 21, adică ce 710 0 ) 
1 2 L4 2)], adică cel mai '€ întreg con 
in NR dial: ai mare intreg continut 
c) Pie y = 2 + tN şi fie 


T,—'?[y* N —y?t(3 — 2] N) + yt(t— 1)(3—21N)/.N —t(t— 1) (£—2)/N?] 


Atunci 


Tagor n< Q+ ¡A ` “APA 3 ay à 
Teorema 1.3 (Stephens (1965)). Repartiția statisticii 


: Vy, coadă 
inferioară. nos 


(a) Pentru UN <2 2 9IN. NS ۵ 
(1 ۱ PIY 
(1.4) PV "d زو‎ ee P(g = N ! (6 1/۷ (۳۷-1 
(b) Pentru 2/N < 2> 3/۸۲ (N > 3) : 
E (N 1)! SQN -1 ? N — 
LE Nd edes ÎN Bor ی‎ rs Mi «)- a (1—8] 
‘ ie au : 
unde t= a, B ۷ solutiile ecuatier 
1.6) و‎ Nas eee 그 (Ne =2?= 0 
) CUBE 20? se. 
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Propoziția 1.2 
ی زرد‎ bj D: 


2. Punctele de semnificaţie ale statisticii Vy 


Teoremele 1.2 si 1.3 au fost folosite pentru calcularea, prin inter- 
polare inversă, a punctelor de semnificație exacte in tabelele 2.1 ۶ 
2.9. Cu ajutorul lui (1.2) au fost obţinute punctele pentru valori mari 
ale lui N. Această expresie dă punctele aproximative care sint mai 
miei, comparativ cu valorile exacte în coada superioară, şi sînt mai 
mari în coada interioară. 

Folosirea acestor valori aproximative dá o eroare mică în pragul 
de semnificație; pentru valori mari ale lui N, prin interpolare în 
graficul valorilor critice exacte existente ale statisticii |N Vu, în raport 
ou 1/N (incluzind acelea pentru N = oo) putem obţine estimatii mai 
bune ale punctelor de semnificație. Punctele de semnificație rămase 
au fost obţinute în acest mod, folosind ca ghidaj punctele date de 
(1.2). Interpolarea poate fi continuată. pentru N > 100; valorile 
critice ale statisticii | N Vy sint incluse în tabel, plasate în paranteze. 
O astfel de interpolare va da o acuratețe mai bună decit prin folosirea 
punctelor asimptotice. Totuşi, pentru valori mari ale lui N lipsa 
de precizie în măsurarea lui 7, poate afecta concluziile testului mai 
mult decît erorile uşoare în punctele de semnificaţie. 


3. Test de concordanță bazat pe Vy 


3.1. Alternativă de ajustare necorespunzătoara 


Dacă cele N observaţii sînt; puncte pe cerc, orice punct de pe 
circumferință poate servi ca origine. 
a) Notăm observaţiile aranjate în ordine crescătoare prin 


jy Day «e EN 

b) Reprezentam F(x) şi Fy(w) definită ca în (5.1.1). 

c) Dacă 

A = max (Fy(w) —F(z)) şi B = max (F(x) — Fy(x)); 

atunci Vy = A + B. m 

d) Căutăm în tabelul 2.1 in linia pentru N; dacă Vy depáseste 
valoarea găsită, respingem ipoteza nulă la pragul de semnificaţie «. 
Valorile din paranteze sînt folosite pentru interpolare. 
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Punctele percentilice în coada superioară pentru Vy şi (în paranteze) pentru VN Vy: 


N 


16 


80 


100 


oOo 


* Valorile subliniate au fost 


15 — c.271 


| 
| 


Tabelul 2.1 


Pragurile de semnificație ca procent 


e 


0,9250 | 


0,776 
0,683 
0,619 


0,571 
0, 
0,501 
0,475 


0,452* | 


0,432 
0,415 
0,386 
0,363 
0,343 


] 0,326 | 
| (1,460) | 


( 


(1 


0,193 
(1,494) | 


0,21 
) 


(1,497) 


0,168. | 
(1,500) | 


| f 0,151 
(1,505) 


| (1,537) 


4) | 


„179 


| (1,620) 


0,9500 0,9750 
0,817 0,871 
0,714 0,768 
0,653 0,700 
0,601 | 0,646 
0,561 | 0, 604 
0,528 | 
0,500 | 
0 77 
0,477 | 

| 


0,456 | 0,492 
| 0,471 
0,408 | 0,439 
0,384 | 0,414 
0,363 | 0,392 


0,437 


0,372 


(1,665) 


0,248 0,268 
(1,571) (1,695) 
0,241 

| (1,701) 


0,204 | (0,220) 
í (1,705) 


| 
0,189 | 0,204 
| (1,707) 


0,159 0,172 
(1,590) 


~ 
~ O 
-1 
El 
e 
<~ 


| (1,747) | 


0,9950 


0,942 
0,864 
0,789 


0,732 
0,686 
0,647 
0,614 
0,586 


0,562 
0,540 
0,503 
0,473 
0,448 


0,427 


(1,908) 


0,352 


| (1,930) 


0,307 


(1,941) 


0,219 


| (1,962) 


0,197 


(1,967) 


| (2,001) 


۱) 
(4; 


0,9975 


0,959 
0,892 
0,822 


0,762 


0,7 


4 


) 


0,676 
0,642 
0,613 


0,496 
0,470 


0,447 


(1,998) 


0,369 
(2,022) 


0,322 


DA 


| (2,034) 


0,289 
(2,042) 


0,264 


| (2,047) 


0,245 
(2,051) 


0,230 
(2,055) 


)6 


0,2 
360) 


| (2,098) 
obținute prin interpolare in graficul valorilor 
exacte ale statisticii VN Vy fata de 1/N, incluzindu-le $i pe acelea pentru N-o9. 


6 ,9995 
0,982 
0,937 
0,881 


0,824 


775 
iio 


0,734 
0,699 
0,668 


0,641 
,617 
),576 


542 


303) 


critice 


Tabelul 2.2 


Punetele percentilice în coada inierioară pentru Vy Și (în paranteze) pentru VN VN- 


Pragurile de semnificație ca procente 
- 
2 0,575 0,550 0,525 | 0,513 | 0,505 0,503 0,501 
: 0,491 0,462 0,425 | 0,398 | 0,374 | 0,362 -| 0,346 
NS | | n 
E 0,434 0,411 0,378 0,351 | 0,325 0,309 | 0,285 
0,388 0,370 0,343 0,320. | 0,296 0,280 0,254 
| 
6 0,356 0,337 0,314 | | 0,273 | 0,260 0,234 
7 0,333 0,315 0,290 0,255 | 0,243 0,219 
: 0,313 0,296 0,274 0,239 | 0,228 0,207 
9 0,296 0,281 0,259 0,225 0,215 0,196 
10 0,282 0,267 0,247 0,214 0,204 0,187 
ii 0,270 0,256 (04237 0,221 0,205 0,195 0,178 
12 0,259 0,245 0,227 0,213 | 0,197 0,188 0,170 
14 0,241 0,228 0,211 0,198 | 0,184 0,175 0,159 
16 0,227 0,215 0,198 0,186 05173 0,165 0,149 
18 0,215 0,203 0,188 0,176 0,163 0,156 0,141 
PX ate 0,193 0,179 0,168 0,156 0,148 0,135 
(0,913) | (0,864) | (0,798) | (0,749) | (0,696) | (0,662) | (0,601) 
= (o „169 0,160 0,147 0,138 0,128 0130 E 
0,923 (0,874) | (0,807) | (0,757) | (0,703) | (0,669) — 
40 der 0,139 0,129 0,121 0,112 0,107 = 
(0,929) | (0,880) | (0,813) | (0,763) | (0,709) | (0,675) < 
50 Ee 0,125 0,116 0,108 0,101 0,095 ec 
(0,934) | (0,885) | (0,817) | (0,766) | (0,714) | (0,681) | E: 
d { 0,121 0,115 0,106 0,099 0,093 0,088 ES 
E (0,937) | (0,889) -| (0,821) | (0,769) | (0,717) | (0,684) = 
et 0 12 0,107 0,098 0,092 0,086 0,082 = 
0,940 (0,891) | (0,823) | (0,772) | (0,720) | (0,687) = 
i AIR 0,100 0,092 0,086 0,081 0,077 = 
0,942 | (0,894) | (0,826) | (0,773) | (0,722) | (0,689) a 
2L cape 0,090 0,083 0,078 0,073 0,069 2s 
0,945 | (0,897) | (0,829) | (0,777) | (0,725) | (0,692) = 
00 (0,973) | (0,9275) (0,8613) | (0,8095) (0,7550) | (0,7212) | (0,6590) 


Pasii b) şi e) pot fi înlocuiţi prin 
b Fie y, = Fle), ¿=1,2, ..., N 
€) Dacă A = max ((¿/N) — ys) si B = max (y, — (1/N')), atunci 
Vy = ۸4 + B. 
3.2. Alternativă de ajustare corespunzătoare 


Se foloseşte tabelul 2.2 si se respinge ipoteza nulă la pragul de 
semnificație « dacă V, este mai mică decit valoarea corespunzătoare 
din tabel. 


4. Legătura dintre statisticile V, şi D, 


Fie 44, Yo, - ++) Yn O Selecţie asupra unei variabile Y. Ne propunem 
să verificám ipoteza, : 
Hy : Y are funcția de repartiție F(F continuă), fata de alter- 
nativa 
Y nu are această funcţie de repartiție. 
Această problemă este echivalentă cu problema verificării 
ipotezei 
X =F(Y) are o repartiție uniformă pe (0,1) 
cu datele: y, = Fy Le, sy). 
In termeni de variabile transformate, statistica V, a lui Kuiper 
este : 
(4.1) V, = sup (SAY —7) — inf (S,(z) — el; 
x €[0,1) x €[0,1) 
unde S, este funcţia de repartitie empirică. Barr, Shudde (1973) 
consideră că a, ...,%, sint observaţii pe circumferința cercului 
unitate cu originea şi orientarea fixate; de exemplu 0 este ora 12, 
cu distanţe pozitive măsurate în sensul direct de rotire a acelor de 
ceasornic. Extindem S, la S, pe [0,2) după cum urmează : 
7 Sale), ze [0,1) 
Seat ce j 
Sal — 1) +1, we [1,2) 
3i, din nou, în notația si terminologia lui Kuiper, tie F?, funcția de 
repartiție empirică unde cumulăm in b saltul de la 2 = 1 la x = 0. 
Rezultă 
Fè (æ) = Silo + b) — S,(b), ze [0,1), be [0,1). 
Cantitatea 
(4.2) sup (F5(x) —/z) — inf (Fi) — a) 
x (0,1) x €[0,1) 
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nu depinde de punctul initial x, deoarece în schimbarea de la b la 
b' (de exemplu), orice cantitate pierdută în termenul sup. este cisti- 
gata în termenul inf. Pentru a vedea aceasta, interpretám (S;(b + 
+ x) — S,(b) — a) ca distanţa verticală dintre funcția de repartiție 
a unei variabile uniforme si funcţia de repartiție empirică extinsă 
S, translatatá la stinga cu b unităţi si coboritá, dacă este necesar, 
astfel încît să conţină originea, ambele fiind calculate in 26101). 
Notam că o astfel de translație poate afecta ambii termeni in (4.2), 
însă prin cantităţi identice. Dacă b este luată ca valoare de selecţie 
æ; = b*, asociată cu saltul in S, unde este măsurată inf (S, (2) — c], 
atunci 

int (Pila) — x), 

xE[0,1) 


este valoarea minimá si 


Va = sup Ela) > al 
j x €[0,1) 
(4.3) بت‎ SUP Sup ارت ای‎ 
bE (0,1). x (0:1]ع‎ 

Din (4.3) urmează că V, este cea mai mare valoare a statisticii 
Kolmogorov-Smirnov generată luind ca punet initial pe cere pe 0. 
Deci putem interpreta V, ca cea mai proastă valoare a statisticii 
Kolmogorov-Smirnov ce poate fi atinsă prin luarea unui punct iniţia! 
nefavorabil. Dacă în absenţa datelor iniţiale se suspectează că expe- 
rimentatorul a selectat punctul iniţial pentru testul Kolmogorov- 
Smirnov după cercetarea datelor, este mai bine să se compare sta- 
tistica test cu valorile critice ale statisticii V, si nu cu ale statisticii 
Kolmogorov-Smirnov. 


b. V, statistică test de tip reuniune-intersectie 


Roy (1953) sugerează construcția de teste pentru ipoteze com- 
puse luînd regiunea de respingere ca reuniunea regiunilor de respin- 
gere a testelor pentru ipotezele simple continute în ipoteza compusă. 
În contextul prezent, aplicarea acestui principiu poate conduce la 
testul V,, după cum urmează : 

A este repartizată uniform pe (0,1) dacă si numai dacă 


X (b) = (X + b) (modulo 1). 


Astfel, ipoteza H, de uniformitate pe cere poate fi privită ca 
fiind compusă si constind din ipotezele simple; X(5) este repartizată 
uniform pentru toţi b. Dacă se foloseşte testul Kolmogorov-Smirnov 


pentru fiecare ipoteză simplă de acest fel rezultatul principiului lui 
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Roy respinge ipoteza nulă, la un prag de semnificaţie corespunzător, 
dacă pentru be [0,1) 


(5.1) Sm FL BRE, 


După (4.3), (5.1) este echivalent cu V, >c. 


6. Unele comparații ale testelor de ajustare 
bazate pe funcția de repartiție empirică 


6.1. Etapele în aplicarea testului 
a) Ordonăm valorile de selecţie si notăm prin 
Lay SL gy S ۰۰۰ < Lim 
statisticile de ordine corespunzatoare. 
b) Estimam parametrii 
b.0 În cazul 0 nu avem de estimat nici un parametru. 
b.l În cazul 1 estimám y prin ۰ 


n 

b.2 În cazul 2 estimăm s? prin s? = Y Ge u)?/m. 
1 

b.3 În cazul 3 estimám pe y prin x si pe s? prin 


n 


se = Y (2, — £)?/n. 
1 


e) Caleulám 2) = F(%4), 1 = 1,n, unde F(x) poate conţine para- 
metrii necunoscuţi. Obtinem 
w, = (a. — %)lo (cazul 1), 
wi = (x; — 1)/8, (cazul 2), 
wi = (xj — @)/s (cazul 3), 
e, fiind ®(w,;). Pentru cazul 4 
رم‎ = 1 = exp (aI). 


d) Pentru toate cazurile statistica dorită se obține cu ajutorul 
valorilor 2 (care sint în ordine crescătoare) astfel : 
— 4. Statisticile Kolmogorov-Smirnov D+, D-, D cu ajutorul 
formulelor (5.2.3) si (5.2.4). 

d.2 Statistica Cramér-von Mises W? cu (6.1.6). 


8 


0,163 


„0 

1,518 
1,628 
0,267 
3,857 

1,035 

1,693 

4 
1,092 


0,1 


1,480 
3,070 
„585 
0,148 
0,138 
0,918 
Stephens (1974) 


0,955 


1 


,489 


0,126 
0,116 


„358 


let 


سم 


. Cazurile 0,3 şi 4 


a comp 


2 


6 necunoscut 
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Punctele percentilice pentru 7* 
24 
3 


Wa, U, 


320 


0,091 


oo 
m 
n 


0:13 
1,610 


D 
5 
Q 
N 
© 
= 
3 
o 
T 
E 
1 
o 

4 
ER 
o 
E 
[1] 

m 
[aj 
S 
H 
o 
E 
ES 

= 
3 

2 
a 
o 
5 
z 
o 
a 
3 
더 


Moditicările statisticilor D, V, 


Modificările testului cind F(x) este cunoscut 


A. 
icată 


D(J n — 0,01 4- 0,85// n ) 


-0,82// n) 


Modi 


1.0. 


* 
بح 


3 
odis 


1 
1.4. Modificárile pentru testul de exponentialitate, 
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W2( 4- 0,5/n) 


Tabelul 6.1. 
Y(l n + 0,05 


e 
© 


U2(1 + 0.16/n) 
A2(1+0,6/n) 


Pentru toţi n. 


Statistica 


we 
U2 
W2 
ya 


D*(D-) 
A? 


d.3. Statistica Watson U? cu (7.1.3). 
d.4 Statistica Kuiper V cu (1.1). 
d.5 Statistica Anderson-Darling A? cu 


(6.19 ای‎ = FN OA 1) [Ine + In (1 — 2,44-0]H/ ^ — ۰ 


t=1 


e) Pentru a aplica testul folosind una din statisticile anterioare 
(s-o notăm prin 7) considerăm tabelul 6.1, pentru cazul K si calculám 
statistica modificată T*: respingem H, la pragul de semnificatie 
ales dacă T* depăşeşte punctul de semnificatie dat in aceeasi linie. 

Testul deseris este obitsnuit un test al cozii superioare ; cînd este 
folosita o transformare pentru a produce observatii uniforme (Cazul 0) 
este necesară coada inferioară. 

Stephens (1974) dă punctele percentilice ale statisticii 7 pentru 

0 3 


cazurile 0, 1, 2, 3 si 4. 


Tabelul 6.1. B 


Punetele percentilice ale statisticilor D, V, W?, U?, A? modificate. 
Cazurile 1 si 2 


ما ل AN MN a‏ سس 


Pragul % 


1.1. Punctele asimptolice pentru W?, U?, A? Cazul 1 (exact) 


w2 | 0,135 0,165 0,196 | 
U? 128 0,157 0,187. | 
A? | 0,908 1,105 1,304 | 


1.2. Punctele percentilice pentru cazul 2 (Rezultate Monte Carlo pentru 
D, V ; rezultate exacte pentru W?, U?, A?) 


Yn-D 10 1,050 1,138 1,270 1,380 
20 1,070 1,160 1,290. j 1,415 
50 1,080 1,170 1,310 1,432 
100 1,100 1,180 1,320 1,440 | 
Ney 00 1,120 1,190 1 1,455 
j^ Vv O) dis 1,305 1,385 1,595 
20 1,345 1,410 1,642 ^ 
50 1,380 1,450 1,680 
100 | 1,390 1,470 1,590 | 1,697 
00 1,410 1,490 1,612 1,720 
W2 toli nz 5 0,329 0,443 0,562 
۳ toti nz 5 | 0:123 0,153 0,182 
A? totin> 5 | | 1,760 2,323 | 2,904 


Stephens (1974) 


231 


Tabelul 6.2 


Punctele percentiliee pentru A?. Cazurile 3 si 4 (Puncte Monte Carlo pentru n finit; 
Puncte asimptotice exacte). 


| Pragul % 
n ]-— — — — ㅡ — -— ===- ۲ — — — 
PX 10 5 M SN | 1 
Cazul 3 
10 | 0,514 | 0,578 | | 0,779 | 0,926 
20 0,528 | 0,501 | | 0,815 | 0,969 
50 0,546 | 0,616 | | 0,861 | 1,021 
100 0,559 | 0,631, | | 0,884 | 1,047 
oo 0:576 | 0,656 | | 0,918 | 1,092 
Cazul 
10 | 0,887 | 1,022 | 1,515 | 1,888 
20 0,898 | 1,045 | 1,556 | 1,927 
50 0:011. |] 10825 4 1.582 1,945 
100 | 0,916 | : 1 | 1,595 1,951 
oo | 0,922 | 1,078 | | 1,606 | 1,957 


Stephens (1974) 


6.2. Exemple 


Exemplul 6.1. Pearson (1963), Inregistrind ruperile consecutive 
ale urzelii într-un război de ţesut, obţine rezultatele 


۱ | | | | 

| ۳ | : | | ÉS | 

i al E. 가 7 AMIA 

| f | | | | 

Fi ENE Dati | : | 

| | | | | 

Rup | | 

urz 30 | 36 | 104 | 286 | 893 55 ۷ 1 | 

| —— — ———— | س I‏ و ————- | — 

i PRAA AE ASA A 17 1 19 20 | 

= Sor ae pus MEAS WERT RET A cR 

lup | | | | | 
urz. |1208 [1240 [1277 [1282 |1421 11477 31504 |1510 |T=1520 
Distanţa dintre ruperi a fost măsurată în unităţi de 100 noduri, 
Notăm distanţa de la punctul de plecare a observațiilor la ruperea 

i prin f, (1 = 1, 2, ..., 20). Lungimea totală a urzelii în c: 


N = 20 ruperi fiind 7 = 1520, 


(6.2) v= E/T (T = lungimea totală a liniei sau 
oad ها‎ = Uy 3 : 

“ae MARI | perioada de observaţie 
astfel 14016 0 > v <1. 
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Figura 8.1 arată funcţia în trepte a observaţiilor reprezentate 
in interiorul pătratului format cu axele v, i/N. Este prezentată o 


valoare tipică a diferențelor 
(6.3) d, = (24 — 1)/ (2N) vi 


pentru + (b 


30 -- ب‎ 
냉수 
16 
14 
d=(2-1/(2N)- ۷ = 

12 EOB 
10} X 

a 


b / 


T supti/N-v,1-0082 / 
; : 
tyr 


Statistica WR (dată de (6.3.3)) constituie o măsură a depărtării 
funcţiei în trepte de la diagonală, ve, = i/N. 

Cele mai mari valori ale statisticii Wi apar cînd punctele au o 
deplasare generală către una sau alta din extremităţile liniei, astfel 
încât d; sînt negative sau pozitive. 

Dacă a, ..., ay este o selecție asupra variabilei cu funcții de 
repartiție F(4), această situaţie apare cînd densitatea de repartiție 
adevărată pentru v, f(z), diferă. de forma, specificată de ipoteza 
nulă, f(x) (notație) prin deplasare în locaţie. Pentru puncte pe cerc, 
valoarea maximă a statisticii Uj} apare cînd toate punctele coincid. 
Pe linia aceasta se realizează fie 

i) cînd toate punctele coincid la un capăt sau în orice alt punct 
sau 

ii) cînd punctele sint dispuse în două grupe de mărime arbitrară, 
unul în fiecare capăt al liniei. 
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Astfel, referindu-ne la problema iniţială, o valoare mare a sta- 
tisticii U% poae fi un semn că dispersia corespunzătoare lui f(a) este 
considerabil mai mare sau considerabil mai mică decit dispersia spe- 
cificatá de ipoteza nulă, însă UX este sensibilă atit la schimbările 
în medie cit si în dispersie ale lui f(x). 

Fig. 8,1. arată, de asemenea, lungimile 


(6.4) sup (i/N — v) si inf G/N — v) 
care dau valori pentru 
i HE 
(6.5) Dy = sup |— — t 
0> ۷ > 1 N | 
şi 
; 1 i "T i 
(6.6) Vy = sup | مب‎ —0,|— int [— — 0], 
" 0> 01 N 0> > N 


unde v = Y »,/N; pentru acest exemplu 
- 


Dy are caracter de valoare extremă si Vy de amplitudine. În condi- 


tiile in care W2( U2) este semnificativ, Dy( V,) va fi mai semnificativ 
în stabilirea diferenţelor. Avem 


Pa (Dh > 0,356) = 0,009; Pu. VÍ > 0,438) = 0,007 
Pu, (W > 0,655) = 0,016 ; Pu,( U% > 0,298) = 0,005. 


D modificat, D* are valoarea 
D* = 0,356 (4,472 + 0,12 + 0,11/4,472) = 1,643 
gi referindu-ne la tabelul 6.1. A dă semnificaţie la pragul de 1% 
(0,01). 

Pentru U?, obţinem U?* = 0,304, care este semnificativ la pragul 
de 0,005, în concordanţă cu rezultatul anterior. 

De îndată ce problema care a fost definită initial in termeni 
de zx, este translatatá în aceea de verificare a aleatorizării punctelor 
pe linie, vor fi mai multe ipoteze alternative. De exemplu, putem 
împărţi linia în mai multe părţi egale, găsim numărul de puncte din 
fiecare parte si aplicăm testul X? pentru a verifica ipoteza, conform 
căreia probabilitățile ca un punct să aparţină unei parti sint egale. 
De asemenea, putem folosi teste bazate pe intervalele dintre punctele 
vecine sau dintre fiecare al k-lea punct. Alegerea între mai multe 
teste trebuie să depindă de ipotezele alternative pentru care testul 
este mai sensibil. 


234 


Exemplul 6.2. Prosehan (1963) dá 213 valori ai timpilor t 
de detectare a echipamentului de aer condiţionat în avioane si verifică, 
ipoteza conform căreia t are o repartiție exponențială cu 0 necu- 
noseut. Găseşte t — 93,14, astfel cá 0 din cazul 4 este 0,0107. Proschan 
obţine pentru F(t) intervalul de încredere 


(Palt) ES 2. F(t) | D 


unde D, este valoarea critică în coada superioară a statisticii Kolmo- 
gorov la pragul «; intervalul de încredere astfel obţinut are coefi- 
cientul de încredere 1 — «. 

Proschan foloseşte 


D, = 1,358//n = 0,0931, 


valoare ce corespunde la « = 0,05 si 1,358 provine din tabelul 6.1.4. 
Cazul 0. În fapt, 1,358 va fi înlocuită prin 1,094 din tabelul 6.1. A, 
Cazul 4; dă un interval mult mai îngust si este rezultatul direct al 
estimării parametrilor. Proschan notează că, cu toate că testul 
pentru exponentialitate nu conduce (aparent) la respingere, totuși, 
variabilele nu par a fi exponential repartizate. Valorile statisticilor 
test sint 


VnD=1,067, W? = 0,324, U? — 0,190 
PASADOS SEES OF 
Cînd se folosește tabelul 6.1.A nici una dintre aceste valori nu este 
semnificativă la pragul de 1095; D nici chiar la pragul de 15%. 


Totuşi, cînd se foloseşte tabelul 6.1.A cazul 4 corect, pragurile de 
semnificatie corespunzătoare acestor valori sint aproximativ 


0,06; 0,012; 0,025; 0,07.si respectiv 0,02. 


Astfel, folosirea lui W?, U? sau A? va conduce la respingere la pragul 
de 5% si chiar D este aproape semnificativ la acest prag. 


7. Programe si subprograme FORTRAN privind 
testul Kuiper 


1. Statistica Kuiper pentru o funcţie de repartiție F se poate 
calcula după formula (1.1). Caleulele se pot face cu subprogramul 
funcție pe care lam numit SVN si a cărui schemă logică este dată in 
fig. 8.2. Cum Fy(a#) este o funcție constantă pe intervale, iar F(x) 
este o funcţie crescătoare, inf (Fy(w) — F(x)) este atinsă in una din 
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marginile din dreapta ale unui interval iar sup (Fx(x) — F(x)) in 
una din marginile din stinga ale unui interval. 


unde: 


X1=F(X(1)) 
Y=S-X1 


Fig. 8.2 


FUNCTION SVN(X,N) 
DIMENSION X(N) 


SO 
SS =O. 
. 0). 


R =1./FLOAT(N) 
HOLE = 1) 8 

Xi = F(X (1) 

Y. Md q 

IF (Y. LT SI) SI = Y 
۳ iuo JA 

TENT AR 
IF(Y.GT:S8)88 = Y 
CONTINUE 

SVN = S8 —.SI 
RETURN 

END 


X — vectorul statisticilor de ordine (real) 

N — dimensiunea vectorului Y (întreg) 

2. Pentru statistica Anderson-Darling dată de formula (6.1) 
am seris subprogramul funcţie SAD. 
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unde : 


X — vectorul statisticilor de ordine (real) 
N — dimensiunea vectorului X( întreg). 


۱۳۸۱۱۳۴۵۱۹۹۱۳ ۱/۵ 


WOMEGATZN 
U=UNPT (Z,N) 
V=SVN (ZN) 
A=SAD(ZN) 


FUNCTION SAD (X, N) 
DIMENSION X (N) 
SAD = 0. 

Jee 

Ni d 

DOLL =1,N 

is Varul 


SAD = SAD + Y«(ALOG (X(I)) + ALOG (1. — X(N1 — 1)) 
(N) — FLOAT(N) 


SAD = —SAD/FLOAT 
RETURN 
END 


OR DM, D W,U.V A 


3. În continuare vom prezenta un program principal în care se 
folosesc subprogramele ce calculează statistici din capitolele 5—8. 
Schema logică a lui este dată în fig. 8.3. 


i2 


E 


= 


bo 


10 


0 


A e cO e 


DIMENSION X(500), Z(500) 

READ (105,1) N,IC,X M,S 

FORMA T(14,11,2F10.5) 
READ(105,2) (X(I),I = 1, N) 
FORM A T(10F8.4) 

CALL SORT (X,N) 

IF(IC. NE.1.AND.IC.NE.3. AND.IC.NE.4) GO TO 3 
XM =. 

DO41=1,N 

XM = XM + XU) 

XM = XM | FLOAT(N) 
IF(IC.NE.2.AN D.IC.NE.3) GO TO 5 
S ss. 

DO6I =1,N 

XIX) AM 

sy Tie Yi 

S = SQRT(S/PLOA T(N)) 
IF(IC.EQ.A) GO TO 8 


0021. 
Z(1)=FI((X(1) — XM)JS) 

GO TO 11 

DO91—1,N 

ZU) = 1.—EXP(X(D/XM) 

CALL SD(Z,N,DP,DM,D) 

W = OMEGA (Z,N) 

U = UNPT(Z,N) ۰ 

V = SVN(Z,N) 

A = SAD(Z,N) 

WRITE(10810) DP,DM,D,W,U,V,A 

FORMAT( STATISTICA KOLMOGOROV-SMIRNOVD+ 
ESTE',F15.6]'. STATISTICA KOLMOGOROV-SMIRNOV 
D- ESTE', F15.6] 

' STATISTICA KOLMOGO ROV-S MI RNOV D ESTE',F16.6] 
‘STATISTICA CRAMER-VON MISES ESTE’, F 20.6] 
‘STATISTICA WATSON ESTE’, 15X, F15.6/ 
‘STATISTICA KUIPER ESTE’, 15X,F15.6] 


N -STATISTICA ANDERSON-DARLING ESTE’, F20.6/) 


STOP 
END 


Datele se prezintă sub forma urmátoare: pe prima cartelá in 
coloanele 1—4 se dá numărul statisticilor de ordine N, în coloana 5 
se dă indicele cazului in care se lucrează IC (0 > IC > 4) si, dacă 
este cazul, se dau valorile valorii medii Y M în coloanele 6—15 (ulti- 
mele cinci cifre sint partea zecimală) şi respectiv a dispersiei S în 
coloanele 16—25 (ultimele cinci cifre sint partea zecimală); pe car- 
telele următoare se dau valorile vectorului statisticilor de ordine X 
cite 10 pe o cartelă (ultima poate fi incompletă) fiecare valoare 
ocupind cite 8 coloane (ultimele patru cifre sint partea zecimală). 
La imprimantă apar 7 statistici şi anume cele indicate în instrucţiunea, 
FORMAT cu numărul 10. Rularea acestui program necesită prezenţa 
următoarelor subprograme : 

SORT — capitolul 5, paragraful 11, punctul 1 

FI — capitolul 1, paragraful 10, punctul 5 

SD — capitolul 5, paragratul 11, punctul 4. 

FX — subprogram funcție pentru funcția de repartiție in ipo- 

teza nulă la testul Kolmogorov-Smirnov. 

OMEGA — capitolul 6, paragraful 8, punctul 1. 

UN PT — capitolul 7, paragraful 9, punctul 1. 

SVN — capitolul 8, paragraful 7, punctul 1. 

F — subprogram funcţie pentru funcţia de repartiție la testul 

Kuiper. 

SAD — capitolul 8, paragraful 7, punctul 2. 

Comparindu-se valorile calculate cu cele tabelate se obţine rezul- 
tatul testului : ipoteză admisă sau respinsă. 
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CAPITOLUL 9 


TESTE DE AJUSTARE PENTRU REPARTITIA VALORII EXTREME 


1. Introducere 


Fie Xm, Xi, -Xm Statisticile de ordine corespunzătoare 
unei selecţii de volum n asupra unei variabile aleatoare avind funcţia 
de repartiție arbitrară. In acest caz, chiar dacă statistica X este 
standardizată, ea nu are, in general, o repartiție limită. Totuşi, dacă 
această repartiție limită există, trebuie să fie una din următoarele 
trei. tipuri : 


(1.1) P  < 0, a < 0 
0, zx > 0 
(1.2) 0056 md 28 
1 y £20 
(1.3) exp (—exp(—x)), —oo > « < oo. 


(1.3) in forma 
(1:35) F(x) = exp[—exp {—(a@ — £)/01], — co « > co 


caracterizează repartiţia duratei de viaţă (legea lui Gompertz), dă 
o ajustare bună a datelor rezultate din experienţele clinice asupra 
subiecţilor bătrîni si este folosită în construirea tabelelor de viata. 

Dată fiind importanţa practică a acestei repartitii, prezintă 
interes verificarea ipotezei H, conform căreia statisticile de ordine 
XA) Ap ..., Am) provin dintr-o populaţie caracterizată de )1. (۰ 


2. Teste bazate pe statisticile W^, U^ si A^ si pe modificări ale acestora 
2.1. Algoritmul 


Paşii în verificarea ipotezei H, sint: 
a) Caleulám 2; = F(a) unde F(x) este dată de (1.3') cu para- 
metrii estimati prin metoda verosimilitátii maxime. Dacă atit £ cit 
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si 0 sint necunoscute (cazul 3), ecuaţiile de verosimilitate maximă 
sint : 


om» Hy) /M—({ ر0((/)2 اوه نهر‎ exp(—24)10)) 
j j i 
(2.1) E = —6log (Y; exp (—2,/0)/ ۰ 
y 


Prima ecuatie potate fi rezolvatá iterativ gi atunci poate fi 
găsit 5. Dacă 0 este cunoscut (cazul 1) se înlocuieşte în expresia 


lui 6, 0 prin 0. Dacă £ este cunoscut (cazul 2) presupunem că لا‎ 
ㆍ ^ ㆍ ^ ㆍ i 
= &«— E $i Û se obţine rezolvind ecuaţia 


(2.2) 09 (2 Y — 2 Y, exp (— 9,19) in. 


Dacă atit 0 cit si E sint cunoscuţi (cazul 0) sîntem în cazul com- 
plet specificat. 

b) Considerăm statisticile dorite W?, U? si A? date in (6.1.6), 
(7.1.8) şi (8.6.1). 

6) Comparăm valorile statisticilor modificate cu punctele din 
coada superioară date în tabelul 2.1. 
: Exemplul 2.1. Dacă într-o selecţie de volum 10, cazul 3, avem 
W? — 0,119 W? modificat, are valoarea 0,1265, care este semnifi- 
cativá la pragul de 0,05. 

Tabelul 2.1 


Punctele pereentiliee pentru statisticile modificate W2, U2, A? 


: Punctel ventili y 
و‎ unctele percentilice în coada 


tica Cazul | Modificarea superioara 
0,75 | 0,90 | 0,95 (0,975 | 0,99 
wa 0 |(W?—0,4/n-+ 0,6/n®) (14 1/n) — | 0,347] 0,461! 0,581] 0,743 
1 |W*(-4-0,6/n) 0,116] 0,175| 0,222| 0,271| 0,338 
2 |Niciuna 4 0,186 0,320) 0,431} 0,547; 0,705 
3 ۱۳۳۹۵40۵2۵ 0,073] 0۵,102 0,124 0,146| 0,175 
U? 0 |(U?—0,1/n-I-0,1/n*)(1 -- 0,8/n) — | 0,152| 0,187| 0,221| 0,267 
1 |U*(--0,16/n) | 0,090| 0,129| 0,159! 0,189| 0.230 
2 |U*à--0,5/J2n) | 0,086 0,123. 0,152| 0,181| 0,220 
3 lux1-+0,2//7) 0,070. 0,097| 0,117] 0,138| 0,165 
A? 0 Niciuna — 1,9331 2,492) 3,070; 3,857 
1 |A%(1-+-0,3/n) 0,736} 1,062} 1,321) 1,591] 1,959 
2 |Niciuna | | 1,060 1,725] 2,277] 2,854) 3,640 
3 |4%1+0,2//7) | 0,474| 0,637| 0,757| 0,877] 1,038 
Stephens (1977 
16 — e. 271 241 


2.2. Adaptare pentru repartiția exponențială 


În cazul 1, 0 este cunoscut si transformarea y = exp (—2/0) 
dă funcția de repartiție F(y) = 1 — exp (—Ay), y > 0, unde A = 
exp (8/0). Un test echivalent pentru cazul 1 este cá y are functia de 
repartitie F(y) cu parametrul de scară A necunoscut. In acest mod 
obţinem cazul 4 din Cap. 7 $ 6, statisticile test avînd aceleaşi repar- 
titii pentru cele două cazuri. Punctele percentilice pentru cazul 4 
sint date in Cap. 8 tabelul 6.1.A. 


E 


3. Teste bazate pe statisticile JnD;, |/nD;, | 72, si ۲ 
3.1. Algoritmul 


Pașii în verificarea ipotezei H, sînt a) de la 9.2.1. 

b^) Considerăm statisticile Di, Dz, D, si V definite in (5.2.3), 
(5.2.4), şi (8.1.1). 

c) Comparăm statistica test corespunzătoare, înmulțită prin 
Jn cu valorile din tabelul 3.1 (Cazurile 1 și 2) sau tabelul 3.2. (Cazul 3) ; 
respingem ipoteza H, la pragul « dacă statistica, test depăşeşte punctul 
percentilic corespunzător. 


3.2. Adaptare pentru repartiția Weibull 

Ne propunem să verificăm ipoteza H, conform căreia selecţia, 
provine dintr-o populaţie în care caracteristica sub cercetare are o 
repartiție Weibull cu funcția de repartiție 
(3.1) P(x) = 1 — exp [—{2/3}"], v > 0 

Dacă punem y = —log 2, atunci funcţia de repartiție a varia- 
bilei y este 

P(y) = exp [—exp {—(y — &)/8}], - 00 > «oo 


cu č = —log 3 si 0 = 1/y. Astfel, problema pusă este redusă la 
probelema verificării ipotezei conform căreia y are functia de repar- 
titie (1.3’) cu & şi (sau) 0 necunoscuţi. 


3.3. Adaptare pentru repartiţia exponențială 


În situaţia din 2.2. statisticile de tip Kolmogorov se calculează 
după cum urmează: 


Se estimează A prin 1/y,y = (1/n) V, y, si se face transformarea, 
à ; 
وه‎ = 1—exp [— (y,/y)], i = 1,2, ..., 8 


242 


Tabelul 3.1 


Punetele percentilice în coada Superioară pentru statisticile Vn Di ; Vn ۱ ۵ Vn Di gk 
ln V, Cazurile 1 si 2. 


————— À 
ere A E A OD IO SNNT S S D 


Pragul de semnificaţie a 
Statisticile n 7 
0,10 0,05 0,025 0,01 
ESO cr ec xus wu ا‎ Id, Les m 1- 
ya Di 10 0,872 0,969 1,061 1,152 
Cazal 1 20 0,878 0,979 1,068 1,176 
50 0,882 0,987 1,070 1,193 
00 0,886 0,996 1,094 1,211 
] 
Vn Di 10 0,99 1,14 1797 1,42 
Cazul 2 20 1,00 1,15 1,28 1,43 
50 1,01 1217 1,29 1,44 
00 1,02 1,17 1,30 1,46 
Va D; 10 0,773 0,883 0,987 1,103 
Cazul 1 20 0,810 0,921 1,013 1,142 
50 0,840 0,950 1,031 1,171 
00 0,886 | 0,996 1,094 1,211 
Vn Dp 10 1,01 1,16 1,28 1,41 
Cazul 2 20 1,01 1,15 1,28 1,43 
50 1,00 1:14 1,29 1,45 
00 1,02 1,17 1,30 1,46 
Vn D, 10 0,934 1,026 1,113 1,206 
Cami 9 20 0,954 1,049 1,134 1,239 
50 0,970 1,067 1,148 1,263 
00 0,995 1,094 1,184 1,298 
yn D, 10 0,76 0,82 0,88 0,94 
Cazul 2 20 0,78 0,84 0,91 0,97 
50 0,79 0,86 0,92 0,99 
00 0,80 0,87 0,93 1,00 
Vn V 10 1,43 1,55 1,65 1,77 
Cazul 1 20 1,46 1,58 1,69 1,81 
50 1,48 1,59 2 1,84 
co 1153 1,65 002 1,91 
yn Y 10 1,39 1,49 1,60 1:72 
Cazul 2 20 1,42 1,54 1,64 1,76 
50 1,45 1,56 1,67 1,79 
00 1,46 1,58 1,69 1,81 


Chandra, Singpurwalla, Stephens (1981) 
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Tabelul 3.2 


Punctele percentilice în coada superioară pentru statisticile Vn D yn Dai, Jn Da 


și Yn V, Cazul 3. 


| Pragul de semnificație 
Statisticil n / 
TIU 0,10 0,05 0,025 0,01 
| 
| 
- G 
yn Df 10 0,685 0,755 0,842 0,897 
2 20 0,710 0,780 0,859 0,926 
50 0,727 0,796 0,870 0,940 
oo 0,733 0,808 0,877 0,957 
Ya Dz 10 0,700 0,766 0,814 0,892 
^ 20 0,715 0,785 | 0,843 | 0,926 
50 0,724 0,796 0,860 0,944 
co 0,733 0,808 | 0,877 | 0,957 
yn D 10 0,760 0,819 0,880 0,944 
E 20 0,779 0,843 0,907 0,973 
50 0,790 0,856 0,922 0,988 
oo 0,803 0,874 0,939 1,007 
yn v 10 1,287 1,381 1,459 1,535 
20 1,323 1,428 1,509 1,600 
50 1,344 1,453 1,538 1,639 
00 | 1,372 1,477 1,557 1,671 


Chandra, Singpurwalla, Stephens (1981) 


Se calculează statisticile D}, Dz, D, si V definite ca in (5.2.3.), 
(5.2.4) şi (8.1.1) 

Observaţii. Pentru a se verifica exponentialitatea, statistica 
|n Di trebuie să fie folosită cu tabelul pentru Vn Dz din tabelul 3.1. 
si statistica, Vn D; trebuie să fie folosită cu tabelul pentru jn Dz. 
Această schimbare în tabele apare deoarece dacă 2*(2**) sint valorile 
z calculate din mulţimea {a,} (după transformarea la y: 


pă = 1 — exp(— yi/y)) are loe relaţia 


^. LL ake 
a: 


UE acm act 
Urmează că statistica Di calculată din 2* va corespunde la D, calcu- 
lată din 2** şi invers. 


Statisticile |n D, si Vn V rămîn neschimbate. 


4, Programe şi subprograme FORTRAN privind testul 
de ajustare pentru repartiţia valorii extreme 


2 s dn Pentru estimarea parametrului 0 folosim ecuaţiile de vero- 
similitate maxima date in paragraful 1. Subprogramul funcție pentru 
estimarea lui 0 l-am numit TETAL iar schema lui logică este dată 
in fig. 9.1. 

| | FUNCTION TETAL(X,N) 
DIMENSION X(N) 
AC = Y: 
DOE — ALN 
1 XM = XM + AU) 
XM = XM | PLOA T(N) 


T = XM 

321 0: \ 
S2 = Ø. i 
DO 21 =1,N | 
X1 = EXP(—XU)/T) | XT 
Si = SL + X1 | Iris 

91| و‎ $2 + X1» X(I) TET 
TETAL = XM — 81/82 ۱۳۲۵۱۹۵ 
IF(TETA1. EQ.T) RETURN 


کی 
GO TO 3‏ | 

| El TD Fig. 9.1 
unde : 

X — vector al statisticilor de ordine (real) 

N — dimensiunea vectorului Y (întreg) 

Observaţie : Avind în vedere erorile de calcul în calculator, am 
considerat drept soluţie a ecuaţiei valoarea stabilizată pentru TET A1, 
adici aceea pentru care diferente a două valori consecutive este zero 
(de maşină). Dacă N este mare sau viteza de convergenţă este mică, 
executarea acestui subprogram poate să dureze foarte mult timp și 

am e 더 spe visa A A E 
de aceea, uneori, se fac modificări în subprogram astfel încît să avem 


DA 
RETURN 
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un număr dat de interatii sau diferenţa dintre TETA1 şi T să verifice 
ITETA1—T]| > e cu e stabilit anterior. 
. 2. Pentru estimarea lui č am scris subprogramul funcţie 1 


FUNCTION 271 (X, N, TETA) AR 
DIMENSION X(N) Guay) 
S = Ø. 

DOL ÎN 
14| & = 8+ EXP 


CITESTE 


SORT! 
XN 


(—XU)/TETA) 


AIL = —TETA — ALOG (S/FLOAT(N)) po 
: IDA 
RETURN 
END ES 
unde : بط‎ > NÚM 
xX — tai al statisticilor de ordine (real) ca 
N — dimensiunea vectorului X (întreg) 
TETA — parametru (real) [XE eR TE ] 
3. Statisticile W?, U} si A? cu funcția de WOES | 


repartitie dati de (1.37) se calculează prin pro- 
cedeul expus în paragraful 2 folosind următorul 
program a cărui schemă logică este dată în fig. 9.2. 
DIMENSION X(590), Z(500) 
READ(195,1) N,IC,TETA,XI 

1 | ¡FORMAT (14,11,2/10.5) 

READ(195,2) (X(1),I = 1,N) 

2| | FORMAT (10 F8.4) 


W=OMEGA(Z,N)] 
USUNPT(Z,N)! 
A=SADIZ,N) 


CALL SORT(X, N) nu 
IF(IC. GE. 2) TETA = TETAIL(X,N) 21 

IF(IC.EQ.1.0 R.IC. EQ.3) XI=XIUX,N,TETA) STOP 
DWS VEN Fig. 9.2 


3 By): = BX P(—BX P( 
W = OMEGA(Z,N) 
U = UNPT(Z.N) 
WRI TE (198,4) W,U,A 

4 FORMAT ('. .STATISTICA CRAMER VON 
C| F15.6/' ,. STATISTICA WATSON ESTP’, 10 X, F15.6/ 

CI" „STATISTICA ANDERSON-DARLING ES TE", #15.6) 
STOP 

END 


—(X(1)—XD)/TETA)) 
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3 pa 
N,IC,TETA,XLX / 


MISES ESTE, 


n 


Pe eartele, datele se prezintá astfel: pe prima cartelá in coloanele 
1—4 se dă numărul statisticilor de ordine N, in coloana 5 să dă indicele 
cazului in care se lucrează IC (0 < IC > 8) si, dacă este cazul, se 
dau valorile lui 0 în coloanele 6—15 (ultimele cinci cifre sint partea 


m 


zecimală) si respectiv a lui £ în coloanele 16—25 (ultimile cinci cifre 


sint partea zecimală); pe cartelele următoare se dau valorile vecto- 
rului statisticilor de ordine X cite 10 pe o cartelă (ultima poate fi 
incompletă) fiecare valoare ocupind cite 8 coloane (ultimile patru 
citre sint partea zecimală). La imprimantă apar valorile statisticilor 
W?, U? si A?. Rularea acestui program necesită prezenţa urmátoa- 
relor subprograme : 

SORT — capitolul 5, paragraful 11,, punctul 1. 

TETA1 — capitolul 9, paragraful 4, punctul 1. 

XI1 — capitolul 9, paragraful 4, punctul 2 

OMEGA — capitolul 6, paragraful 8, punctul 1. 

UNPT — capitolul 7, paragraful 9, punctul 1. 

SAD — capitolul 8, paragraful 7, punctul 2 
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CAPITOLUL 10 


acţionează drept catalizator pentru aceeaşi reacţie. Dacă Mo, G, 


TESTE DE AJUSTARE PENTRU REPARTITIA LOGISTICA sînt concentrațiile initiale ale i M şi respectiv G, iar y este valoarea 


comună a concentratiilor lui J şi K la momentul £, atunci legea, ac- 
tiunii masei este 


dy ۳ 
)1.4( —— = € Mo (Go — y) + 60 (Go — y) 
07 
unde c; și e; sint constante catalitice pentru acţiunile M şi J. 


Membrul drept al acestei relaţii poate fi scris ca 


1. Introducere | E AD (v A 1 (+ pui » 2 (+ A fac (| 
06 Ca 08 


Ne propunem sá verificăm ipoteza H, conform căreia X, 
Xu 그 Sint statisticile de ordine corespunzătoare unei selecţii 
de volum n asupra unei variabile aleatoare X avind repartiţia logis- 


care este de aceeaşi formă ca (1.2) cu F, æ înlocuite prin (+ + <M} 
C5 


C1 


tică cu functia de repartitie : și respectiv ¢ gi eu e = yA = 0; B = G,--—. M,. 
Ca 
(1.1) F(a) = [1 + exp{ — (x — a)/8)]?, —o<u<oo, 8>0, Statistic, repartitia logisticá se poate obtine ca repartitia limitá 
ا‎ NA D SA me ۱ a unui n 3 SA sy | 
Această funcţie de repartiție este folosită pentru caracterizarea iultiplu al rapor tului dintre X, şi Xq) | 
funcțiilor de creştere cu x reprezentind timpul sau ca model al auto- 
catalizei. Astfel, tinind seama că i : فا‎ e 
rata de crestere = = (excesul faţă de valoarea asimptotică ini- 2. Estimarea parametrilor repartitiei 
tialá A) (deficitul comparat cu valoarea asimptotică finală B), T 
avem ecuaţia diferenţială : În 16 egatura cu parametrii œ şi B putem avea următoarele situaţii : 
3 Cazul 0: atît x cit si 6 sint cunosc uti, astfel incit F(x) este | 
1۳ و‎ complet specificată 
2 = e[P(z) — A][B — F(z)] E pie a : : : | 
(1.2) (in e[P(x) ۳ )2([ Cazul 1: Beste cunoscut si x trebuie estimat | 
l Cazul 2: x este cunoscut şi B trebuie să fie estimat şi | 
unde c, A si B sint constante, e >0, B > A. Cazul 3 : « si 6 sînt necunoscuţi si trebuie estimati. 
Soluţia acestei ecuaţii este : În cazul 3, estimatiile de verosimilitate maximă sînt obţinute 
B Dek + A din ecuațiile : 
(1.3) F(x) = TBE 5 d 
「 T / € ` 1 A f I. 
li 2.1) n! Y [1+ exp{aw — &)/8)]71 s 
unde D este o constantă. Cînd x= — co, F(x) > A; cind v — co, i 2 
T ] ] ^ ۹ / 
F(s) x» B, D * 0. ام‎ ‘ 1 s 29) -1 Y Quy — A in exp! (Lo a )/f } 
Dacă luăm A = 0 si B = 1, (1.3) devine (2.2) & 5, A — id ES | 
; 8 l-rexpliz, — x)/B) 
De! : à i ; 
X A j -la aje |- ps i . ۰ — 더 9 
F(x) = و‎ qs [스가 A Mane Aceste ecuaţii pot fi rezolvate iterativ: مه‎ = zx si By = s(s? 
e -+- ㆍ 
» dispersia de selecţie). putind fi folosite ca iid initiale. În cazul 1, 
care este de forma (1.1) cu e = 8; D = 8 pentru ru lui &, este folosită ecuaţia (2.1) cu 8 înlocuit prin p. | 
3 ( ۲ D 다 T / Pi y / D 
| Autocataliza este reacția chimică | in care catalizatorul M trans- in cazul 2, pentru obţinerea lui 8 este folosită ecuaţia (2.2) cu â 
formă componenta G în două componente J si K, iar J la rindul ei înlocuit prin ud 
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3. Teste bazate pe statisticile W^, U^ si A? 


Pentru verificarea ipotezei H, sint necesari următorii paşi 

a) Caleulám 2, = F(x,) unde F(x) este dată de (1.1) cu para- 
metrii estimati. Fie 2 media variabilelor 2,, 2, .. ., 2,. 

b) Caleulim statistica test dorită: W?, U? sau A? definite in 
(6.1.6), TRES) si (8.6.1). 

c) Referindu-ne la tabelul 3.1 caleulim mai intii statistica 
modificată si apoi comparám rezultatul obţinut cu punctele percen- 
tilice superioare pentru cazul corespunzător. 

Exemplul 3.1 Presupunem că într-o selecţie de volum 20, cazul 
2, valoarea lui A? este 2,150. Statistica A? modificată are valoarea; 
2,182 care este semnificativă la pragul de 10%. 

Tabelul 3.1 


Punctele percentilice pentru statisticile W?, U?, A? modificate 


Statis-| B Punctele percentilice superioare, œ 

a à Modificarea 1 = 

tica | 3 0,75 | 0,90 | 0,95 10,975 | 0,99 | 0,995 

w2 0 |(W2—0,4/n-+0,6/12)(1,0+ 1,0/n) | 0,209} 0,347| 0,461| 0,581| 0,743| 0,869 
1 |(1,9n W2—0,15)/(1,9n — 1,0) 0,083| 0,119| 0,148| 0,177| 0,218| 0,249 
2 |(0,95n W? —0,45)(0,95n —1,0) 0,184| 0,323| 0,438| 0,558| 0,721| 0,847 
| 3 |(nW2—0,08)/(n—1,0) 0,060] 0,081] 0,098} 0,114] 0,136) 0,152 

U? 0 |(U2—0,1/n 4- 0,1/n2)(1,0 +0,8/n) | 0,105| 0,152| 0,187| 0,221| 0,267| 0,304 
2 |(1,6n U?—0,16)/(1,6n—1,0) 0,080| 0,116] 0,145| 0,174| 0,214) 0,246 

A? 0 |Niciuna 1,248| 1,933| 2,492| 3,070| 3,857| 4,500 
1 ۱۱۸۶ ۷۰ 0,615| 0,857| 1,046| 1,241] 1,505] 1,710 
2 |(0,6n A?—1,8)(0,6n —1,0) 1,043) 1,725| 2,290| 2,880| 3,685| 4,308 
3 |A2(1,04+0,25/n) 0,426| 0,563} 0,660] 0,769| 0,906| 1,010 


Pentru U? cazurile 1 si 3 se folosesc niodificările si punctele percentilice pentru ۴ 
cazurile 1 si respectiv 3 
Stephens (1979) 


4. Teste bazate pe statisticile D;, D;, D, si V 


Pasii în verificarea ipotezei H, sint 

a) Calculám 2, = F(x») unde F(z) este dată de (1.1) cu para- 
metrii estimati. 

b) Calculám statisticile Dt, Dz, D, si V definite ca în (5.2.3), 
(5.2.4) si (8.1.1.). 

e) Comparám statistica test corespunzătoare împărţită prin 
Yn cu valorile din tabelul 4.1. 
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Tabelul 4.1 


Punctele percentilice superioare pentru statisticile D+/ yn; 
D||n si V//n pentru cazurile 1, 2 si 3 


Statistica ۷۸ 


E N o 
Cazul 2 0,90 0,95 | 0,975 0,99 
nos | 
1 5 0,702 0,758 0,805 0,854 
10 0,730 0,792 0,846 0,913 
20 0,744 0,809 0,867 0,944 
| 50 0,752 0,819 0,880 0,962 
co 0,757 0,826 0,888 0,974 
2 5 0,971 1,120 1,239 1,380 
10 0,990 1,143 1,268 1,423 
20 0,999 1,150 1,282 1,444 
| | 
| 50 1,005 1,161 | 1,290 | 1,456 | 
00 1,009 1,166 1,297 1,464 
I 
á | | 2 
3 5 0,603 0,650 0,690 0,735 
10 0,636 0,687 0,736 0,789 
20 0,653 0,705 0,758 0,816 
| 50 0,663 0,716 0,773 0,832 
00 0,669 0,723 0,781 0,842 
Statistica D//n 
1 5 0,736 0,791 0,845 | 0,883 
10 05777 0,837 0,895 | 0,953 
20 | 0,800 0,865 0,920 | 0,997 
| 50 0,808 0,874 0,937 1,011 
nodo oss. 0,816 0,883 0,947 1,025 
| ee 
2 5. 41.108 1,849 | 1,474 
10 1,148 1,388 1,521 
NC LM AT, 1,406 | 1,545 | 
SO T 4-179 1,419 1,559 | 
00 1,187 1,427 1,568 | 
3 5 0,643 0,679 0,723 0,751 
10 0,679 0,730 0,774 0,823 | 
20 0,698 0,755 0,800 0,854 ; 
50 0,708 0,770 0,817 0,873 
oo 0,715 0,780 0,827 0,886 
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Tabelul 4.1. (continuare) 
| Statistica V/Vn 


——————————————— سس 


SO! | 


Cazul 1 0990 0,95 0,975 0,99 
pores | 
1 | | 
1 5 | 1,369 1,471 1,580 1,658 
10 | 1,410 1,520 1,630 1,741 
20734 7.31 499 1,550 1,659 1,790 
50 1,447 1,564 1,675 1,815 
00 1,454 1,574 1,685 1,832 
2 54 | ESHA 1,432 1.547 1,674 
| 10 | 1,372 1,483 1,587 1,711 
| 0 1,400 1,510 1,607 1,730 
| 50 | 1,417 1,5259. 1,019 1,741 
| eo. 0 1,535 1,627 1,748 
| ۱ 
3 | 58-1 1,170 | 1,246 | 1,299 | 1,373 
| 10 | 1.230 | 1,311 | 1,381 | 0 
| 20 | 1260 | 1,344 | 1,422 | 1,514 
50 1:277 1,364 1,448 1,542 
00 1,289 1,376 1,463 1,560 


Stephens (1979) 


Observaţie. Punctele pentru D; fn pot fi folosite de-asemenea 
pentru D;/\/n. Valorile asimptotice au fost gásite prin extrapolare, 
ceea, ce face ea acurateţea să se determine cu dificultate. 


5. Programe si subprograme FORTRAN privind testele de ajustare 
pentru repartiția logistică bazate pe funcția 
de repartiție empirică 


Pentru început vom prezenta subprograme de estimare a para- 
merilor « şi 8 folosite în calculul valorii funcţiei de repartiție dată 
de (1.1.). 

1. Dacă se cunoaşte 8 se poate calcula valoarea lui a utilizind 
relația de recurenţă ce rezultă din relația (2.1.). 


1 1 - , 1 
== A de rae Y (1 + exp((2, — o4/B) ^ 
2 n i 


Subprogramul funcţie ALPAL realizează acest lucru plecind cu 
valoarea « = €. Schema lui logică este dată in fig. 10.1. 
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| |FUNCTION ALFAUX,N,BETA) 


DIMENSION X(N) 
B — Q.5*FLOAT(N) 
| 0). 
| |DO1I=1,N 
1 | ۸ =A + XI) 
| |A = / FLOAT(N) 
21|18=B 
DOST IN 
3] |S = S — 1./(1. +EXP((X(1) — A) 
c | BETA) 
| | ALFA1 = A + SJPLOAT(N) 
| IF(ALFA1.EQ.A) RETURN 
| |A = ALFA1 
| [60 TO 9 
| [END Fig. 10.1 
unde : 


X — vectorul valorilor statisticilor de ordine (real) 

N — dimensiunea vectorului X (întreg) 

BETA — parametrul 8 (real) 

2. Daca se cunoaşte a se poate calcula valoarea lui 8 utilizînd 
relaţia de recurenţă ce rezultă din relaţia (2.2) 


1 1 — exp ((x 8 
xp ((1, — 
Bia E bai Y: (a; RU a) = I ((a; a) /B,) 
20 1 + exp ((2, — «)/B,) 
Subprogramul funet ie BETA) realizează acest lucru plecind cu 
valoarea وق‎ = s. Schema lui logică este dată in fig. 10.2. 


FUNCTION BETAY1(X,N,ALFA) 


DIMENSION X(N) 
€ = —1./ PLOA T(N) 
|XM =9. 


DOLT = 1, N 


11) 2M — XM Cx 
XII rM 
Sis pk 
POSTLI N 
E a POEM 
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x 
E 
ip 
= 
BE 


T 

1 

i [ses S +(X(1) EV 
B=V/S/IN-1) 


e! 


X1-X(D-ALFA | 


[BETA EA] C-A 


roade [B-BETA T] 
(RETURN ) 


Fig. 10.2 


Biri = 


Subprogramul l-am 1 
data in fig. 10.3. 


ko piaia 


ALBE, iar schema lui logici: este 


23] ToS = ie o TRACT: 

B = SQRT(SIFLOA T(N —1)) 
4 A =. 
DOS 4 = LN 
Xl X(1) ALFA 

= EXP (X1/B1) 
3 A vas A: X1 * (1.—X2)/( 
BETAL =Ux A 
IF(BETA1.EQ.B) RETURN 
B BETAL 
GO TO 4 
| END 


1.+X2) 


unde : 

X — vectorul valorilor statisticilor de 
ordine (real) 

N — dimensiunea vectorului X (întreg) 

a LFA — parametrul « (real) 

3. Dacă atit a cit si B sint necunos- 
cuti, se pot estima vi alorile lor din siste- 
mul dedus din relaţiile (2.1—2.2) : 


943 = % T 


(1 + exp((2y — %)/B))- 


1 — exp((ay — 0)/81) 
+ exp((a, — sedi ۵,( 


iumit 


SUBROUTINE ALBE(X,N,ALFA,BETA) 


DIMENSION X(N) 
C = O.54F LOA T(N) 
D = 1./FLOAT(N) 

| A e . 
DO11=1,N 
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1] |4 - ۸ xa) 
Eier 
EO 
no diu 
Xi n A 
2 Eg 오정 EX 
| | B = SORT (BIPLOA T(N —1)) 
donus es 
|IT— 9. 
DO4T =1,N 
[XL AT) A 
| x2 = - EX P(X1 IB) 
۳ = 8-1.1 + X2) 
TTX ور نم‎ 
A LF uj سس‎ A سل‎ S ek D 
BETA E DEP 
IF( ALF A.HQ.A.AND. BETA. EQ.B) 
RETURN 
As ALFA 
BS BETA 
GO TO. S8 
END 


X2) 


€ 


unde : 
(real) 


ALFA — valoarea calculată pentru a 
(real) 

BETA — valoarea calculată pentru 8 
(real) 

4. Statisticile W?, U? si A? cu functia 
de repartitie dată de (1.1) se calculează 
prin procedeul expus în paragraful 2 folo- 
sind următorul program a cărui schemă lo- 
gică este dată în fig. 10.4. 


DIMENSION X(500),Z(500) 

REA DU 095,1) N,IC,ALFA, BETA 

1 | | FORMAT(I4,11,2F10.5) 

READ(105,2) (X(1), I = 1,N) 

2 | |FORMATOOFS.4) 
CALLSORT(X,N) 


X — vectorul statisticilor de ordine | 


N — dimensiunea, vectorului X (întreg) 


X1zX(1)-A 

X2:eX1/B 

S=S-1/ (X2) 
T=T+X 19 (1-X2)/(14X 2) 


ALFA= > NU . [A-ALFA 
Ses le-eera 


cain 0 m 


Fig. 10.3 


| |IPUC.EQ.1) ALFA = ALFAUX,N, BETA ) 
IF(IC.EQ.2) BETA = BETA UX,N,ALFA) 
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| |IFUC.BQ.3) CALL 
c| ALBE(X,N,ALVA,BET A) 
DO 3 7 =1,N 

| ZU) = 1./(1.4 BXP(—(XU)— 
c| ALFA)/BETA)) 
|W = OMEGA (Z,N) 

U = UNPT(Z,N) 
A = SAD(Z,N) 

2 | W RITE(98,4) W,U,A 

£^ | 4 | [FORMAT (STATISTICA : 
FA XN cl CRAMER — VON MISES ESTE’, 
c| F15.6//, -STATISTICA 
c| WATSON ESTE’ 1OX,F15.6/ 
이 STATISTICA ANDERSON — 
C 


CHESTE 
N,IC,ALFA, BETA, X 


APEI | | DARLING ESTE, F15.6) 
[eas send RETE | | STOP 
| [END 
+ ~ | 


DA | Datele se prezintă in felul următor : 


T M Dă 
ALBE — 
XN ALFA, BETA] | 
|: ۹۸ ES 


pe prima cartelă se dă numărul N al sta- 
tisticilor de ordine in coloanele 1—4, in- 
dicele cazului în coloana 5(0—a si B cu- 
noseute, 1—-8 cunoscut, 2—a cunoscut, 
3— x si B necunoscute) si, dacă este cazul, 
se dau valorile lui x în coloanele 6 —15 
(ultimele cinci cifre sint partea zecimală) 
si respectiv B în coloanele 16 —25 (ultimele 
cinci cifre sînt partea zecimală) ; pe car- 
telele următoare se dau valorile vectorului 
statisticilor de ordine X cite 10 pe o car- 
telă (ultima poate fi incompletă) fiecare 
valoare ocupind cite 8 coloane (ultimile 
patru cifre sint partea zecimală). La im- 
primantă apar valorile statisticilor W*, EA 
şi A?. Rularea programului de mai sus necesită prezența urmatoa- 
relor subprograme : 


لت ود هس 


W-OMEGA[ZN] 
U-UNPT pul 
| A=SAD(Z,N) 


Fig. 10.4 


SORT — capitolul 5, paragraful 11, punctul 1 
ALFA1 — capitolul 10, paragraful 5, punctul 1 
BETA1 — capitolul 10, paragraful 5, punctul 2 
ALFA — capitolul 10, paragraful 5, punctul 3 
OMEGA — capitolul 6, paragraful 8, punctul 1 
| UNPT — capitolul 7, paragraful 9, punctul 1. 
SAD — capitolul 8, paragraful 7, punctul 2. 
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APITOLUL 1 


TESTE DE AJUSTARE PENTRU 0 IPOTEZĂ SIMPLĂ BAZATE PE FUNCȚIA 
CARACTERISTICĂ EMPIRICĂ 


1, Introducere 


Două argumente susțin folosirea funcţiei caracteristice ca bază 
a unor]teste de ajustare. Mai întîi faptul că repartiţia unei variabile 
este complet determinată de functia sa caracteristică, ceea ce face 
ca verificarea ipotezei 


(1.1) Eye RAs) = I) 


sa fie echivalenta cu verificarea ipotezei 


(1.2) H; : o(t) = M(e#X) — e dF (x) 


şi apoi observaţia că 2, definită in (6.4.2) ca 
2 x Aes 
Za || — Y cos (jr X,) 
T ral 


este partea realá (exceptind un factor de normalizare) a functiei 
caracteristice empirice 


evaluate in t = jr, j = 1,2, ...,". Această observaţie conduce la 
căutarea unor teste care să folosească (1.3) pentru valori ale lui t care 
nu sint necesar multipli de x şi cînd variabilele {X,} nuFsint necesar 
repartizate uniform pe [0, 1]. 


17 — c. 271 207 


2. Repartiția asimptotică a vectorilor de parti reale si 
imaginare a funcţiei caracteristice 


Pentru orice 7 fixat nenul putem 80116 
M(e#*) = u(t) + iv(t) 
Urmează cá 
(2.1)  M(eostX).— u(t), M(sin tX) - v(t), 


+ 


1--eos i Du: 


y 


(2.2) 


M(cos? (X) = M | 
M(sin? tX) = i 


1—eos 2t X 1 n 
gre = —[1 — u(2t)] 


1 ^ 
D*(cos tX) idunt [1 + u(2t) — 2u*(t)] 
(2.8) 
NE n 1 
D?(sin tă) = 2p — w(2t) — 2v*(t)] 


9 


a 


t) X + cos (t, ۳ 


— M(cos t, X) M(cos را‎ ( [ult +t) Hult, —t,) —2u(t,)u(t,) ] 


ale 


mye ۹ cos (1 
cos(sin #,X, sin t,X) = M : (i 


— M (sin t, X) M(sin t, X). = [u(t —t,) —u(t, +t.) — 2v(t,)v(t,) ] 


eov(eos tX, COS tx — M k OS (f - 
(2.4) 


no | بر‎ 


eov(eos t, X, sint, X) = M ks (y ch) sin وا‎ tr) 3 
9 
(2.6) 
— M (eos t, X) M(sin tX) uf [v(t,-+-t,) —v(t, — tr) — 2u(t, )o(t,)] 
Corespunzátor funcției caracteristice din ipoteza nulă H, (al- 
ternativă Hj) şi functiei cracteristice empirice 9, avem părţile reale 


Up(U,) si Un Si părţile imaginare %p(0,) şi v,. Date m numerele reale 


258 


tu ty, +++; 1, definim vectorul 2m dimensional 
(2.1) Eyes (ulita) اب و‎ Volta o e co om), v= OF d, 
şi matricea simetrică X, 2m x 2m avînd elementele date de 2x co- 
variantele din 
(2.4) pentrul<j,k<m 
(2.5) pentru m + 1 < j,k < 2m 
(2.6) pentru 1 < j < m; m + 1 < k< 2m. 
Fie X,, Xs, ..., X, o selecţie asupra variabilei aleatoare X avînd 
funcția caracteristiciá M(e"*) gi 


(2.8) Ust) 4 2 eos tX,, V(t) == LS sin tX, 


N r= N r=1 
Avem 


M[U,G] = ult), M[Val(t)] = 00) 


1 LUN E 
D*[U,(t)] = i D*(cos tX), D?[V,(t)] = — D?(sin tX). 


10 n 


Teorema 2.1 Dacă este adevărată ipoteza Ho, asimptotic 


(i) U,(t) ~ N (uid. ), 그 Di(eost: 3 
n 
(2.9) Pins Way a VPE TET 
D,(cos tX) 
o Y.) ~ x efi), Diam ix) 
1 
VAI rd — MUT 
(2.10) ۳ و‎ Ara 21 نم‎ N(0, 1) 
D,(sin tX) 
Teorema 2.2 i) Dacă D?(costă)>0 pentru t = tus tz, <<<, tm; 


atunci vectorul de componente 


۱۸۱۷, (5) — w(t)], VntUs(QS) —(t9)] «++ VntUs(ta) — (tm) 
converge in repartiție către wn vector normal m dimensional de vector 
valoare medie O si matrice de covariante avînd elementele date de (2.4). 

ii) Dacă D?(sintX) > 0 pentru t = ty, tg, ..., 14, atunci vectorul 
de componente 


Vn[Valt,) — 95] Va Volts) — v(5)] ۰۰ Va Val v(1)] 


converge în repartiție către un vector normal m dimensional de vecter 
valoare medie O si metrice de covariante avînd elementele date de (2.5) 

Teorema 2.3 Dacă matricea E, nu este singulară și dacă este 
adevărată ipoteze Hy, atunci asimptotic 


(2.11) Qi 5 2n(&, = 60) رد‎ UP Ee) ay x'(2m) 


3. Teste de ajustare 
a) Respingem ipoteza H; la pragul de semnificatie « dacă, 
(3.1) [Un] > 21-072 
Puterea acestui test în ipoteza alternativă 


Hi: M(e'*) = ut) بل‎ Tt) 


este 
' Ar DN [— (t) — ut) ۰ 
mC) PU ah I v BD ~<a Pia. رای‎ Tail. c ML + 
H! F 1-a/ ] y D,(cos tX) 
(3.2.) 
"n md ras PE ۱ WS (15 g(t) — u(t) D, (cos tă n "T J 
D,(cos t.X) D,(cos t X) D (cos tX) ۱ 


si in toti 7 pentru care momentele specificate de diferitele ipoteze sint 
distincte, lim m (t) = 1. 
1400 1 
Dacă M(X*)< oo, folosirea statisticii U,(t) cu |t! mie, pentru 
verificarea schimbării în scalá, este asimptotic echivalentă cu folo- 
sirea dispersiei de selecţie. 
Într-adevăr 
PENA ha A iA Rav 
u(t) = 1-—-— M(X2) + — M(X9*) + 0(), jt) — 0 


DEI 4! 


si notind prin u4, momentul de ordinul k în ipoteza j găsim 


lim AZ mă -- E mE] 
im>o D,(costX) Kui — us 


(cos LY RERUM 70 
lim D(cos tX) ۳ E p20 


Deci pentru n suficient de mare si || suficient de mic, lunctia de 
putere (3.2) creşte cu | ust — pep). 
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Exemplul 3.1 Ne propunem să verificam la pragul de semni- 
ficatie « ipoteza 


Leg 
Ho: e(t) — exp | — $^] 
fata de 


1 ie 1 
H,: e(t) = exp | 전우 i), 0< 0< 2, 0 dat. 


Din (2.1) gasim 


1 Iu. 
u(t) = exp | aoe e), tlt) = exp( zm 


si ug(t) S u(t) după eum 0 > |t] < 1 sau |1| >1. 
Din (2.3) 


2800 = = [1 + exp(—28) — 2 exp( —£)], 
9 


1 


€ 


Dinlt) = ]1 + exp (= 2°24) — 2exp (- ㅡ 10001 


bo 


si, exceptind cazul |t| = 1, regiunile critice unilaterale sint optime. 
În continuare folosim teorema 2.1 punctul i. 
Pentru 0 > |t|< 1, asimptotic regiunea critica este 
U,(O = We, o | 
pa L 사드 
Don(t) 


[usto : Vn 


şi puterea este dată de 


[n AO دب‎ an) 
Du. 20 


Pentru |t| > 1, asimptotic regiunea critica este 


yz Ust) — ut) |. | 
fuso 00000 - ss] | 


iar puterea 


— Uolt) — u(t) Dox(t) 4 ۱ 
1-0 ) LA a 
: (Va Dialt) Dal) | 


Pentru |t| = 1, asimptotic regiunea critică este dată de (3.1) 
şi puterea de (3.2) cu u(t) = u(t). | 
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Studiem eficiența procedeului în cazul verificării ipotezei 
(3.3) Hy: u(t) = u(t, 85) 


fata de şirul de ipoteze alternative 
(3.4) H : u(t) = u(t, 9 + 8n-42), 


00 fiind parametrul ce întră în repartiţia variabilei studiate. 
Eficienţa Pitman a testului bilateral bazat pe statistic: U, 1) 
cu regiunea critică (3.1) este lim r ,(t) unde r (t) este dată dei3.2 $ 
mene a, ENTRE 


Uolt) = u(t, 05) si (t) w(t, و0‎ + 5n- V? 


Deoarece, pentru n — oo, 


j 


CA Rea ai un 
u(t, و0‎ + 8g V?) = u(t, 05) + -= ۷ 05) + O(n -?) 
Vn 
urmează că 
Di(t) = D*(t, 0, + 3n-W2) = ۰, 05) 4 Lr Pe (2.4, 0 
Nh a Carats Ny 


Și 
lim /n wo(t) — u(t) _  9w'(t, 00 
موب بو‎ D,(t) DU, 9) 
lim zu MK 
موب«‎ D,(t) 
Cu acestea, din (3.2) gásim 
lim x (t) =o Caen i i ( at du (i, Bo) + 21-02 | + 
mo Hi D(t, 8) ۲ 
(3:5) 


+ 0 m du (4, 0o) SA an) 
DU, 9) y 


„Dacă există cel mai bun test pentru verificarea ipotezei (3.3) 
fata de (3.4), atunci alegem ca ۲ acea valoare care face minimă dife- 
renta dintre puterea acestui test cel mai bun şi puterea (3.5) Acest 
lucru revine la a alege 7 ca acea valoare care minimizează (3.2). 

In general, cel mai bun test este unilateral si nu bilateral pu- 
terea acestuia fiind mărginită superior de j i 


(3.6) 1— و02‎ SVT) 
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unde 
3.7 I= M| 
(3.7) ( R 


cu P funcția de verosimilitate corespunzătoare selecţiei de volum n 
asupra variabilei aleatoare ۰ 
Testul unilateral bazat pe U, are puterea درد وج‎ (t) astfel încît 
oT 


02 In E ۱ 
9-0, 


Su «Lu. 71D); 
D(t, 00) 
avind egalitate cind t satisface relaţia 
+ AA 
D*(t, 05) 


(3.8) lim To, pana /2(t) w 1 = A(z- R 


b) Respingem ipoteza Ho la pragul de semnificație « dacă 


| Va] > 2-a 


Puterea acestui test în ipoteza alternativă H, este 


(t) = PUVal > امه‎ Hi) = 1 — UU Volt) — ei) 


D,(sin tă) 


T , 
Hi 


(3.9) 


Do(sin tX y — Volt) — y(t D,(sin tX) 
o^ - Mn +0 Vn ol 1 a(t) H of da, AUN 
D,(sin tă) D,(sin tX) D,(sin tX) 
şi lim r ,(۸)ر‎ 1. 
Peco A A un "m ۲ 
În cazul simetriei faţă de origine v(t) = v(t) = 0 si z (t) este 
mărginită, întotdeauna de 1. À 
Dacă M(X?)< co, 
lim ————— — == > 
1150 D,(sintX) Yun as 
a Do(sin tX) ad y Uso — Uo 
uo D,(sin tX) 
şi din (3.2), cînd |t|— 0, puterea creşte cu | ui; — Lio |, statistica Va 
folosindu-se pentru verificarea schimbării in poziţie. 
e) Resping ipoteza Ho la pragul de semnificaţie « daca 


Qn > Xa(2m) 


V(t) — %4(t) bio — Ua 


r , 78 
Mo — 1 


Prezintá importantá alegerea corectá a numárului de puncte 
ㆍ 더 ㆍ T v o ㆍ v a ㆍ - 
f... Em Si poziţia lor. Dacă ţinem seama că Q9 este o funcţie para 
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pentru fiecare t, vom alege punctele din regiunea m-dimensionalá 
Satisfacind 0 < f, > ... < tm. 

Dacă H; este o ipoteză simplă, valorile optime 1 vor fi valorile 
care maximizează puterea testului, adică 


(3.10) P(Qn > ys(2m) | Hy) 


sau aproximativ valorile eare maximizează valoarea medie a statis- 
ticii Q} în ipoteza Hj 


(3.11) . M(Q2 Hi) = 2n(& — o) "Ee" — En) + Ur(E5" Ej) 


Deoarece ğ,„(t) converge in probabilitate către g(t), acest test 
este consistent fata de alternativele cu o,(t) 4 q(t). 

Fata de testul X?, testul bazat pe statistica Q, înlătură pier- 
derea de informatie datorată grupării datelor şi arbitrarul alegerii 
intervalelor; are desavantajul că introduce problema alegerii va- 
lorilor ۰ 

1 Esemplul 3.2 Ne propunem să verificám la pragul de semnificatie 
a ipoteza, 
H, : e(t) = exp (—t?) 
fata de 


H,: p(t) = exp (—| |°) 
in scopul studierii parametrului de formă cînd parametrii de scară 
şi poziţie rămîn aceiaşi. Cînd m = 1 (2.11) devine 
2n[U,(t) — exp (— 8)? V(t) 
(1 — exp (— 2(2 [1 — exp ( — 4t?)] 


A = 


şi respingem H, dacă Q% > 23201). 
Avem 


MOH) — 2m[exp (—|t|*) — exp (— t?)]? yi 
[1 — exp (— 29)? 
exp (—| 2¢|°) + 1—2exp(—2]|t]) , 4050 (= E) 
[1 — exp ( — 2)72 ne „All exp (— 412) 
si cum lim M(Q7 Hj) = مه‎ si lim M( Hi) = 2 vom alege pe t in 
apropierea, lui Zero. th 


Observaţie. Prezintă importanţă extinderea acestei metode 18 
cazul in care parametrii sînt necunoscuţi şi trebuiesc ‘stimati; de 
asemenea extinderea pentru rezolvarea problemei de a;ustare în mai 
multe dimensiuni. 
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CAPITOLUL 12 


ÎNLOCUIREA IPOTEZELOR COMPUSE CU IPOTEZE SIMPLE 
ECHIVALENTE 


1. Introducere 


În acest capitol prezentăm caracterizări ale repartitiilor expe- 
nentiale si normale prin statisticile de ordine din populaţiile uniforme 
şi a repartitiei normale prin repartiţia Student. Folosind aceste 
caracterizari transformam ipotezele compuse în ipoteze simple echi- 
valente. În general puterea testelor pentru exponentialitate bazate 
pe această caracterizare este mai bună decit a testelor similare pentru 
normalitate. Acest lucru se intimpla datorită faptului că verificarea 
a n observaţii pentru exponentialitate este redusă la verificarea a 
(n — 1) sau (n — 2) observaţii pentru uniformitate, în timp ce veri- 
ficarea a n observaţii pentru normalitate este redusă la verificarea 
a (n — 3)/2 observaţii pentru uniformitate. Aceste teste pentru nor- 
malitate sînt foarte puternice fata de alternativele simetrice ca 
Laplace, Logistică 81 Cauchy, însă au putere mică pentru alternativele 
asimetrice. E 


we ` 


2. Caracterizarea ‘repartitiei® exponentiale* 


Teorema 2.1. Fie X,, X,,...,X,, n> 3 variabile aleatoare 
pozitive independente si identie repartizate. Fie 


(2:1) S, NS SNL Aa ee AEA pa EA ON A S 


In aceste conditii, repartitia comună e statisticilor (Z, „-,) este aceea 
a (n — 1) statistici de erdine dintr-o selecție de volum (n — 1) asupra 
unei variabile U(@, 1) dacă $i numai dacă Xi, Xs, ..., X, este o se- 
lectie asupra unei variabile X repartizată exponențial de densitate 

$1 
(2.2) f(x) = — exp (— a/0.), » > 0, 0,— e, 


2 
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O versiune a acestei teoreme cu X; avind o densitate continua 
se găseşte în Seshadri, Osórgó, Stephens (1969) (demonstraţia fiind 
adevărată numai pentru o valoare fixată a lui S,, deci într-un sens 
condiţionat), Csérgé, Seshadri ((1970), (1971)), si Csórgó (1972). 

Teorema 2.2. Fie X,, Xs, ..., X,, n>3 variabile aleatoare in- 
dependente identic repartizate cu funcția de repartitie continuă si X; > 0, 
(0, număr real) pentru toți i. 

Fie 
(2.3) da == E L9) (Ata — Aien) pt = L ym 
unde Xom = 이, Xin sînt statisticile de ordine ale variabilelor X, şi 
(2.4) 


r 
Se = y HAS او و وا‎ Uy Ew TS Ses r=1,2, ....%— 1 


i=l 


In aceste conditii următoarele două presupuneri sînt echivalente 
a) Xi, Xs, ..., X, este o selectie asupra unei variabile exponentiale 
X cu densitatea 


(2.5) dior) = al —(a#— 0,)/0,) 
2 

b) Sin, 1 — 1,2, ...,n sînt variabile aleatoare independente identic 
repartizate si repartiția comună a variabilelor (Z,.n-1, 1<r< n — 1) 
este aceeași cu a statisticilor de ordine corespunzătoare unei selecții de 
volum (n — 1) asupra unei variabile repartizate uniform pe (0, 1). 

Observaţie. Repartiția statisticii 3;, depinde de parametrul 
nedorit 6,, astfel încît pentru a înlătura acest neajuns formam Z,:n-1- 

În baza teoremei 2.2 putem înlocui ipoteza compusă 

Ho: X,, Xs, ..., X, este o selecţie asupra unei variabile expo- 
nentiale cu densitatea (2.2) cu ipoteza simplă echivalentă 

H; : Zen 1<r<n —1 au aceeaşi repartiție comună ca şi 
statisticile de ordine corespunzătoare unei selecţii de volum n — 1 
asupra unei variabile repartizate uniform pe (0, 1). 

Pentru verificarea ipotezei H, folosim testul exact al lui Pearson, 
bazat; pe statistica 

n—1 
(2.6) —2 Y In Z,4,-,  x?[2(n — 1)]. 
r=1 

În urma studiilor privind puterea testelor pentru verificarea 
exponentialitátii a reieşit că testele care sint bazate pe statisticile 
Z,.,-, din teorema 2.2 sint mai puternice decit acelea bazate pe teo- 
rema 2.1. Ipotezei nule care se referă la densitatea (2.2) i s-au con- 
siderat alternativele : x2(v), v = 1, 3, 4, 6, 8, 10, lognormalá (0,1). 
Weibull (Ek) :7(2) = ka*-! exp (— 2%), k = 0,5; 2 şi beta (1,2). Pentru 
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» 


` 


Le n 

testul Lilliefors, s-a estimat 0, prin A = و‎ X,/n. S-au folosit testele 
1 

x, Di, Dz, Da, Cramér-von Mises, Anderson — Darling si Pearson, 

fiind preferat testul exact al lui Pearson. 


Dacă 0, este necunoscut, nu mai poate fi calculată statistica 31 :m 
din (2.3). Totuşi, testul poate fi bazat pe din, i = 2,...,m gi 


e / n 
x / a 

Zrn-2 = Y din Y dt) 2 > ۲ که‎ 9 1 
=2 =2 


au aceeași repartiție cu statisticile de ordine corespunzătoare unei 
selecţii de volum (n— 2) asupra unei variabile repartizate uniform 
pe (0,1). 


13, Caracterizarea repartitiei normale 


3.1. Prin repartiția Student 


Teorema 3.1. (Kotlarski (1966)) Fie Xo, Xi, ..., Xp, n>2 
variabile aleatoare independente cu P(X, = 0) = 0 și cu densitatea 
de repartiție simetrică față de zero. Condiţia necesară si suficientă ca 
AX, sd fie variabile aleatoare identic repartizate N(0, c?) este ca 


Y o Y 
Y; eS X — rm EL); Y, = Va _ ~ 1(2), TE | 
| Xo| yx + xi 
(3.1 O 
Y, = os / : = ~ t(n), 
PERS A 


Y,, Ya, ..., Y, fiind variabile aleatoare independente 

O teoremá echivalentá cu aceasta este 

Teorema 3.2. (Kotlarski (1966)). Pie Un is de a ul re 03 
variabile aleatoare independente pozitive. Fie 
(3.2) 2 UU Ue ES ae e y ۱ uy 


Condiţia necesară si suficientă ca U; ~ x2(1), += 0,1, ...,” 
este ca Vi, Vo, ..., V, să fie independente si V; să aibe densitatea 


RED 
; 0-1201 +) ^ 
(3.3) j 
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Teorema 3.3. (Csórgó, Seshadri, Yalovscky (1973)). Pie X,, 
b cad a A > 4) variabile aleatoare independente cu M(X;) = u; 8i 


DAX) = 
Fie ۱ 
(3.4) Zp = (> Ape Xin) lY$($ 4-1, i= 1,2, ...,,—1 
1 
| Y, e Sf 
(3.5 — y 
7 LI 


Atunci X, ~ N(u, o?) dacă si numai dacă Y,, Y, ..., Y sint 
independente si Y, ~ t(k). 

În baza teoremei 3.3 putem înlocui ipoteza compusă H, : X,, 
Xs, و...‎ Xn(n>4) este o selecţie asupra unei variabile X ~ N(u, c?) 
cu ipoteza simplă echivalentă 
Ho: Y, . . Yn-2 Sint variabile aleatoare independente si Y, ~ tk), 
Pe Di 2. 

Observaţie. Numărul de variabile aleatoare a scazut numai cu 
numărul de constante necunoscute eliminate. 

Pentru verificarea ipotezei Ho folosim testul raportului proba- 
bilitátilor astfel : 

Considerim Y REY RA tana y OY) FRENADO 
unde G, este funcţia de repartiție a Sa NDI t(j ۸ Deci y, este reparti- 
zată uniform pe (0, 1) si statistica lui Pe ved este 


19-2 


(3.6) ار‎ E E A TI y 
jd 
Avem 
n— 
(3.7) و-م2۳‎ = Y (—2 In 34) ~ y12(n — 2)] 
j=l 


3.2. Prin repartitia uniforma 


Teorema 3.4. (Csórgó, Seshadri (1970)). Pie X,, Xe, ..., Xn, 
n= 4k, k 2 3 variabile aleatoare independente identic repartizate. 


Y, dni FLU T NUN: 


T 
8, =Y Y, r=1,2, A IS O A ETE 
t= 


In aceste condilii repartiția comună a variabilelor (Z,:x-1, 1<r<k—1) 
este aceeași cu a statisticilor de ordine corespunzătoare unei selecții de 
volum k — 1 asupra unei variabile aleatoare repartizat: uniform pe 
(0, 1) dacă și numai dacă X; ~ N(u, c?) 
Această teoremă permite să se înlocuiească ipoteza nulă compusă 
Ho: بیط‎ Xe, -.. Xn, n = 4k, k>3 este o selecţie asupra unei 
variabile N(u, c?) 
cu ipoteza simplá echivalentá 
Ho: Zi, rt... Ziyi k-1; Sint statisticile de ordine corespunzătoare 
unei selectii asupra unei variabile repartizate uniform pe (0,1). 
Observaţii i) Ipoteza Hy poate fi verificată cu teste de tip 
Kolmogorov — Smirnov. De exemplu 


l&r«h 


Dr max ۳ Zr) 


si va avea aceeaşi repartiție ca si Df cînd este bazată pe statisticile 
de ordine corespunzătoare unei selecţii de volum =% dintr-o populaţie 
uniformă pe (0, 1). 

ii) Teorema 3.4. foloseşte cel putin 12 observaţii deoarece 
n Hk sik > 3. 

Teorema 3.5 (Csórgó, Seshadri, Yalovscky (1973)). Fie X; 
Xo ... X4, n= 2h +8, k>2 variabile aleatoare independente 
identic repartizate cu dispersia o?, 0 > c? < co. Fie 


y 223] VE E 3 Rise E le eid 


2 7 2 2 Y 3 
L1 =Z - 43, Y, = Z3 + Za, t +1 Z5: A =i 
k = (n — 3)/2 
k 
5 ۳ A Y 『 
2, „IS } 1 2. و‎ KE CU De = Y PAN 1 12 4 k 1 
4=1 


In aceste condilii sini echivalente urmátoarele două presupuneri : 
a) A «e dau, o^) 

DI d ut وا‎ ... k +1 sint variabile aleatoare independente 
identic repartizate si repartiția comună a variabilelor (Zei), 1<r<k 
este aceeași ca a statisticilor de ordine corespunzătoare unei selecții de 
volum k asupra unei variabile repartizate uniform pe (0, 1) 

Observaţii i) Testul bazat pe teorema 3.5 este mai sensibil la 
abaterea de la normalitate decît cel bazat pe teorema 3.4; pentru Z, 
transformarea din teorema 3.5, conserva independenta lui Z, daca 
şi numai dacă X, sînt independente ; în timp ce Z, din teorema 3.4 
sînt independente deoarece X, sint independente. 
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ii) S-a redus numărul n al observaţiilor la k = (n — 3)/2. 
iii) Această teoremă înlocuiește ipoteza nulă compusă 
Ho: X, ~ N(u, o?) 
cu ipoteza simplá echivalentá 
Hoe APE ag y In Za, ~ x°(2k), k = (n— 3)/2 
r=1 
Exemplul 3.1. (Osórgó, Seshadri, Yalovsky (1973)). Ne propunem 
să veriticăm ipoteza conform căreia, numerele 
30. (AOS 22251204 24 5019. 18 AO TELS, sy Oo Va Ea OR I 
VOLI 19 120. 245 193513. I0 lg" 175 18518 
ی رال یلا9‎ OT: A 1? 40 .168.,30 40 31 
dd: 19) US 0209 0799 T6 AS 19" 200 da 
سل‎ LS ddr 375.23. 28 11440. 15 19, 15,22 20, 48 
20 241. 37: 20... 201,20, 31 21 17 18."007101 46 
Todos LOL مر‎ 24 16 13) 15, 17 
17 
constituie o selecţie asupra unei variabile normale cu media şi dis- 


persia necunoscute. În acest scop vom folosi teorema 3.3 și statistica, 
(3.7). Avem 


Ha pa pa 
Cr Or SS 
= 

-1 e 


bo 


= 
00 
= 
bo 


97 
y DE ee Da Sale Op, Y ln y, = 171,7050: 
ŞI j=l 
2420. e y^ (194). 
Cum pentru valori mari ale lui x, 


P(V2y2(n) — Van —1 > x) = O(a) 
urmează cá, aproximativ, y 22300) ~ N(V2n — 1,1). 
În cazul de faţă 
(2(171, 7050))/? — (2(194) — 1)/2 = — 1,15 
81 9(- 1,15) = 0,1251. 
Astfel, la pragul de semnificaţie « — 0,10, nu vom respinge 
ipoteza de normalitate. 
Testul X? cu 10 clase egale, conduce la X? — 15 
. Din tabele xi_a(7) = x$,5(7) = 14, 1 şi deci la pragul de serani- 
ficatie « = 0,05 respingem ipoteza de normalitate. 
Din tabele xi-a(7) = X39e(7) = 18,5 şi deci la pragul de semni- 
ficatie « = 0,01 nu vom respinge ipoteza de normalitate. 
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iar Schema lui logică este dată în figura 1 


4. Program şi subprograme FORTRAN privind testele exacte de 
normalitate în prezenţa parametrilor necunoscuți 


1. Valoarea funcției F,(Y,) (funcţia de repartiție Student) se 


poate calcula după formula : 


Subprogramul ce calculează valoarea acestei functii l-am numit 


FUNCTION FJ(Y,J) 
6-19 

IF(J.EQ.1) GO TO 1 
DOD I~ 2 J 
G=(I—1)/(4+4) 

G —GISQRT(J*3.141593) 
R— —(J 4-1)/2. 

SI=1. 

BX MO, 


NASO 


DO 3 1=1,20 

X=X+H 
SI=SI+4x(1. - X X[J )s R 
X=X+H 

ST= SI +2x(1.4- Xx ل/‎ (#۷ R 


| 07 --0,5 40*77 7 


RETUR] 


END 


unde : 
Y — conţine valoarea corespunzătoare lui Y, (real) 


J — conţine valoarea indicelui lui Y, (întreg) 


X=X+H 
SI = SI+4 (1+X2/))R 
X=X+H R 
| |S1=S1+2(1+X 27/5) 


RETURN 


Fig. 12.1 


FJ=1/2+ G-H-SI/3 
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Am ținut seama de formula de recurenţă : 
2] 


"( : yee cu il = as 

(4.2) Sad aa ty it 34a nt agi} Vr 

(a) (3) 

2 2 

iar integrala a fost calculată prin metoda Simpson (vezi capitolul 1, 
paragraful 10, punctele 5 si 6). 

2. Folosind functia de mai sus, se poate serie subprogramul 

funcţiei SPN pentru calculul statisticii Pearson (3.6), a cărui schemă 

logică este dată în figura 12.2 


em FUNCTION SPN(X,N 
(START) DIMENSION Tun ra? 
S1=X(1) 

==). 

| | SPN=O. 

Z=(X(1) —X(2))/1.4142135 
Ni=N—2 

DOL TINA 

99 9 1-72 

| | 81-81 +27 -1( 

| | Z=(S1—1Ix*X(1+2))/ 
0| SQRT (PLOAT(U +2 
| | Y =Z/SQRT(8S2/1) 

| | Y1—FJ(Y,D) 

1| | SPN=8SPN—2*ALOQ(Y1) 
| RETURN 

| | END 


)*(7--1))) 


unde : 


X — vectorul statisticilor de ordine (real) 
N — dimensiunea vectorului X (întreg). 

În subprogram se foleseste subprogramul funcţie FJ. Vectorul 
X trebuie să aibă valorile elementelor în ordine crescătoare. 

3. Pentru calculul statisticii Osórgó, Seshadri, Yalovscky data 
în teorema 3.4 am seris subprogramul funcție OSY, a cărui schemi 
legicá este data înitigura,.12.3 


272 


|| FUNCTION CSY(X,N) 
|| DIMENSION X(N) 


S1—@. 
S2=0. 
CSY=0. 


۰۱ ۳1-۱ ود‎ 
BO. 1 1—1, Ni 
S1=81+X(1) 


i S1=S1+X(I) 


اد 


| | Z=(S1—1*X(1-+41))/ i [Z-tST-PXG VEDA 
C| SQRT(FLOA T(Is(I —1))) IL. 
| | $2=Z*Z +82 | 


| | LF(I.EQ.Ij2«2) OSY = — ALOG10(82) 
이 +08 Y 

1 | | CONTINUE 

|| S1I=81+X(N—1) 

| | Z=(S1—(N —1)&X(N))] 


IN PT AT. T | S1=S1+X(N-1) 
e SQET(FLOAT(N«*(N —1))) | Z=(SI-(N=1) X(N)/AVNAINED) 
| | K=(N—3)/2 , LCSY=CSY+(N-3):log ($2424) 
| CSY —CS Y --2«4 Kk «ALOG1O0(S2--Z«Z) Y 
| | RETURN CRETURN) 
| | END Fig. 12.3 
unde : 


X — vectorul statisticilor de ordine (real) 

N — dimensiunea vectorului X (întreg) 

Vectorul X trebuie să aibă elementele în ordine crescătoare, iar 
valoarea lui N trebuie să fie de forma 2K --8, unde K este un întreg 
Kees 2: 

4. Un program pentru acceptarea sau respingerea ipotezei fe- 
losind statisticile din acest capitol este următorul : 

DIMENSION X(500) 
| READ' (105,1) N, ALFA 


1 FORMA T(14,F10.4) 
REA D(105,2) (X(1),1=1,N) 
2 | | FORMA T(8SFAQ.5) 


CALL SORT(X, N) 

| S1=SPN(X,N) 

W RITE(108,3)81 

3 | | FORMAT( .STATISTICA PEARSON ESTH:,F15.6) 
| LF(S1.G T.FLOAT(N +N- 4) GO TO 4 

| WRIT H(1@8,5) 

FORMAT ('_IPOTEZA ADMISA”) 

| GO TO 6 


Ou 
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WRITE(198,7) ai y y 
FORMAT('. IPOTEZA RESPINSA”) 
S2—CSY(X,N) 
WRITE(108,8) 2 Ne PA j xy do TUE 
FORMAT STATISTICA CSORGO —SESHADRI-Y ALO- 
O VSKY :,F15.6) 
X1=HIPTAK(ALFA,N-—2) 
IF(S2.GT.X1) GO TO 9 
W RITE(108,5) 
STOP 
9 | | WRITE(198,7) 
STOP 
END 

În program se folosese subprogramele SPN si CSY din acest 
capitol şi subprogramele SORT din capitolul 5, paragratul 11, 
punctul 1 si HIPTAK din capitolul 1, paragraful 10, punctul 6. 
Statistica Pearson a fost comparată cu 2N —4 iar statistica Csórgó — 
Seshadri—Yalovsky cu xi-«(N —3) pentru acceptarea Sau respin- 
gerea ipotezei. Datele se prezintă pe cartele in telul următor : pe 
prima cartelă se dau valorile numărului statisticilor N în coloanele 
1—4 si pragul de semnificație ALFA în coloanele 5—14 (ultimele 
4 sînt zecimale) iar pe următoarele cartele se dau statisticile de ordine 
cite 8 pe o cartelá, ocupind fiecare cite 10 coloane (ultimele 4 sint 
zecimale). i j AA 

La imprimantá apar valorile celor douá statistici si rezultatul 
aplicării testului (IPOTEZA ADMISA sau RESPINSA). 


ane 
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Mamo”. 


B OP 11,9, 170 1.1443 


OBSERVAȚII PE CERC 


1. Introducere 


Presupunem că se dă o selecţie de n direcţii in forma an puncte 
Pi i = 1,2, ...,1n pe circumferința cercului unitate cu centrul in 
O ; pentru a ne referi la direcţia determinată de centrul O şi punctul 
P, folosim fie punctul P; fie vectorul unitate OP,. Apar astfel de 
selecţii în studiul migrării păsărilor sau al instinctului păsărilor sau 
animalelor de a se întoarce acasă, în meteorologie (direcţiile vintului) 
şi în geofizică (direcţiile pietricelelor în albiile de riu în studiul alu- 
necării ghețarilor). 

Observaţii similare pot apărea dacă considerăm cercul ca o 
perioadă de timp (de exemplu o zi) și punctele sînt înregistrate în 
timpul zilei : momentul activităţii maxime a organismelor marine 
sau momentele accidentelor de trafic. Alte observaţii sînt furnizate 
de fenomenele ciclice din economie. 

Pentru a analiza o astfel de selecţie avem nevoie, mai întîi, de 
repartiţia direcțiilor sau mai precis de repartiţia coordonatei polare ۵ 
a vectorului tipic OP; măsurată de la o axă fixă 0 = 0. Repartiția 
coordonatei polare 0 este repartiţia von Mises. 


2. Repartiția von Mises. Geneza 


Richard von Mises (1918) consideră tabela cu greutățile atomice 
ale elementelor din care extrage următoarele 
as iniu see i ee ALEEA ENO A o dl 
| Sb | Ar | As | Ba | Be Bi 
| 
TASA A EE A aa atac ana ua a 


j 
| | 
Gr. atomică w | 26,98 | 121,76 | 39,94 | 74,91 | 137,36 | 9,01 {209,00 


ㅣ 
Elementul | Al 
| 


şi-şi pune întrebarea: „Un element tipic într-un anumit sens are 
greutatea atomică un număr întreg”? O interpretare naturală a 
acestei întrebări este „Părţile fractionare ale greutăților sint apro- 
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piate de 0 si 1?" Într-un mod firesc greutăţile W pot fi identificate 
«cu puncte de pe cercul unitate, astfel încît părțile fractionare egale 
„corespund la puncte identice. Aceasta se poate realiza prin aplicaţia : 


Wox= | هدن‎ >) 0, = 2n(W — [W)) 
sin 0, 


"unde [u] este cel mai mare întreg mai mic decit u. Întrebarea lui 
von Mises poate fi echivalentă cu următoarea : „Aceste puncte de 
» a 
pe cere sint apropiate de e, = | ۱ ? 
0 
Aplicația W — x mai poate fi privită si ca 


o Oe MOON ia că do ri ael «Ww. zl) 
sin 0, 2 2 ) 


Atunci cele două mulţimi de unghiuri corespunzătoare celor două 
aplicaţii sint 


ㅣ ㅣ | | 
Elementul! | Al | Sb | Ar As Ba | Be | Bi | Media 
| | | | | 
0,/2: 0,98 | 0,76 | 0,94 | 0,91 | 0,36 | 0,01 | 0,00 | 0,/27 = 0,566 
0/2 —0,02 | —0,24| —0,06|—0,09| 0,36 | 0,01 | 0,00 | 8/27 = 0,006 


Din discrepanta mediilor date in ultima coloană urmează că 
modul obişnuit; de descriere a datelor prin medii şi abateri standard 
încetează să mai fie folositor pentru măsurătorile de direcţie. 

Dacă punctele sint apropiate de e, atunci vectorul rezultat 


N 
Y x (N = 7) va fi pe această direcție, adică vom avea aproximativ 


Ixi = e, undex = Y x,/N si x || = (xx)? lungimea lui x. Pentru 
cele 7 elemente ale căror greutăți sînt considerate aici găsim 


싸기 0,9617 cos 344,09 X. ( eos — d 
x/||x!| = 고 | I| i ; 
— 0,2741 sin 344,09° ر‎ | sin "15,917 ) 
care nu este o direcție deplasată mult de e. Atunci von Mises isi 
pune întrebarea ,,Pentru ce repartiție pe cercul unitate vectorul 
A 


unitate; = in: 3 = X/||x|| este estimator de verosimilitate 
\ sin 0, "Ub 

maximă a direcţiei 0, de concentrare sau de apriopiere”. Răspunsul 

este repartiția cunoscută astăzi sub numele de repartiţia von Mises 

sau repartiţia normală circulară. Această repartiție are densitatea 


1 À 
(2.1) f(9) = al (E) exp )8 cos(0 — 0,)), X > 0 
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unde 9 este unghiul aleator, 

00 d 2 
(2.2) (A) = y dii s: x) este funcția Bessel. 

jo 2 

Densitatea (2.1) are valoarea maximă in 0 = 0, si valoarea 

minimă in 0 = 0, + x. Astfel maximul si minimul sint situate in 
direcţii opuse in lungul aceleiaşi linii numite axa repartitiei. Direcţia 
9, poartă numele de polul repartitiei. Raportul dintre valoarea ma- 
xima si valoarea minimă este eX. Dacă 9 — 0 repartiţia se reduce la 
repartiţia uniformă. Cînd Æ creşte repartiţia devine din ce in ce mai 
concentrată în jurul polului. 


3. Estimarea parametrilor repartitiei von Mises 


Daca 0,, 9, ..., 0, este o selecţie asupra variabilei aleatoare 0 
avind densitatea (2.1), atunci ecuaţia de verosimilitate maximă este 
LAY In. 1194) 


(3.1) 1 


j=1 69, |=, 


E 


ôln f(0 Bu 
s i) E E PERI E 
69, 
si alegind & pozitiv, conditia 
n 
Y sin(0; — 99) = 0 
i=l 
„rată că dacă valorile observate sint reprezentate ca puncte pe cir- 
cumferinta cercului cu centrul în origine si 0; este unghiul intre axa 
orizontală si vectorul unind originea cu observaţia 1, atunci 6, dă 
o direcţie medie. - 
Estimatorul de verosimilitate maximă pentru 0$, 0, satisface 
ecuația 
n A 
(3.2) Y; sin(0, — 6) = 0 
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^ 
iar estimatorul de verosimilitate maximă pentru 9€, X ecuația 


d In ZK) ۲ ی‎ A 
e Y cos(0, — 9). 
ds nN j=1 
A 
Daeá 0, este cunoscut, atunci dispersia estimatorului * este aproxi- 
mativ 


2ln1,(A) 1-1 
(3.4) or à 
dst? 


(3.3) 
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Dacă este cunoscută numai axa, adică se ştie că 0, este egală fie cu 


y, fie cu y + r, atunci vor fi folosite valorile absolute ale 


unghiurilor. 


4 [¡Statistici pentru verificarea unor ipoteze privind observaţiile pe cerc 


4.1. Statistica N 


Considerăm o selecţie de n puncte pe circumferința unui cere 
şi ne propunem să verificám ipoteza conform căreia selecţia este 
făcută asupra unei variabile repartizate uniform pe circumferință 
În acest scop vom folosi statistica N definită ca numărul maxim de 
puncte din selecţie ce poate fi acoperit de un semicere convenabil ales. 
Valoarea statistică N se calculează după cum urmează. La tiecare 
punct x; din selecţie facem să corespundă punctul diametral opus 0;. 
Atunci fiecare semicerc va contine n puncte 2; sau o; Alegem un semi- 
cere şi o direcţie pozitivă pe cerc. N depinde numai de grupul de n, 
2 şi o luat în direcţia pozitivă în lungul semicercului ales. Sint po- 
sibile 2” astfel de grupe, fiecare egal probabilă. Aceasta urmează din 
rotirea semicercului în direcţia pozitivă; se obţin 2n grupe de » 
simboluri succesive care împreună descriu configuratiile tuturor semi- 
cercurilor. Fiecare grup de n se obţine din precedentul inlaturind 
primul simbol si adáugind simbolul opus la sfîrşit. Astfel toate gru- 
pele de n si în consecinţă si N sint determinate de prima. 

Considerăm primul grup de n si definim variabilele aleatoare 
independente 81 identic repartizate 


1, dacă simbolul 1 este 0 


(4.1) X,= 
—1, dacă simbolul i este x 
FL X, = 1) = P(X, x er ter 1) = is ㆍ 


Dacă notăm numărul de puncte din cele 2n semicercuri diferite prin 


Ba gy شب‎ Lips! ARTO! 
(4.2) Kg = ROE Ag ERTS 
(4.3) Hi Mas 
unde S, = Xi + Xo, + ... + Ap 
Avem 
z 1 A y Fi Y 1 Y 
(4.4) K, = xs (n — Sa), Kiri = 8; + S (n ANONS A Te 


Au loc următoarele rezultate 
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f 1 | 
Teorema 4.1. Pentru k.= Iz] EUR e 


“a 


oo 
P(N >k) = 2-0-b(2k — n) Y, Of m+ 


Teorema 4.2. Fie N* = (2N — n) [n și 0 un număr pozitiv fixat. 
Atunci 


oo 
lim P(N* ze) = 4e Y 9[(2j + 1)c] = 22/1320 x 


120 و 1۷ 


- AT 23 
X Y exp | 7 5 3j + nte] 


j=0 


Exemplul 4.1. Ne propunem să verificăm ipoteza conform căreia 
directiile de zbor ale unor porumbei, materializate prin unghiurile 


20°, 35°, 80°, 85°, 85°, 120°, 280°, 320^. 345°, 350° 


constituie o selectie asupra unei variabile repartizate uniform pe 
circumferința cercului unitate. 
Pentru 0< t< fie N(t) numărul de puncte din selecţia data 


FS f 
2 


9 


^ f ۱ 3 ۲ T OF 
localizate in semicereul cuprins între 360% si 360 ( FI Cind 


o 


360 t° creşte de la 0° la 180^, M(t) descreste cu o unitate cind 3607 
depăşeşte un z. Deci valorile lui N(/£) in intervalele succesive sint 
Ai fag, 4 

Statistica N este egală cu cea mai mare valoare atinsă de N(t) 


sau n—N(t) pentru 0 < t <. —. Astfel. N = 9. Căutăm in Tabelul 4.1 


9 
pentru n = 10 si k — 1 si găsim cá în ipoteza de normalitate, 


P(N > 9) — 0,156, astfel că abaterea de la ipoteza emisă nu este 
semnificativă. 


4.2. Statistica A, 


Presupunem că variabila aleatoare y este lungimea arcului, 
măsurată de la o origine convenabilă, în jurul circumferinței cercului 
a, cărui circumferință totală este L; dacă punctele reprezintă direcţii, 
atunci poate fi ales ca origine Nordul, rnăsurarea fácindu-se în sensul 
pozitiv de mişcare a acelor ceasornicului. Ipoteza nulă H, afirmă că, 
selecţia 94,95, ㆍ -Yn Y fost făcută dintr-o populaţie în care caracte- 
ristica sub cercetare are funcţia de repartiție F(y), 0 > y < L. 
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1 BH nnt iol iem CONEA 


ES 1 Mai întii facem transformarea 2, = F(y,) astfel că 0 <a ba 
a | 주 x atunci a, sint dispuse pe cercul C avînd circumferinta 1. | 
a 3 3 Deci în ipoteza nulă, x, sînt repartizate uniform pe cercul 0. ۱ 
EENEN. Presupunem cá pe cercul C, punctul A are coordonata a(mod 1) si 
OPTIMO: ¡3 E punctul B coordonata b (mod 1); fie (a, b] intervalul deschis la stinga, 
= | A 4 pt A Ad de la A la B în sens pozitiv. Fie N(%) numárulpunctelor x poe ees erm 
o NEN i 1 : $ 
o E. 4 : 
n IAE care cad in ( 4,9 + zi Pentru verificarea ipotezei H, folosim 
2 pe iN 9 d 
لها‎ [때 VOA O LET 3. o 9 E Pai 2 
7 eU 5 E statistica, 
o M [e T he By © IS o nes E / 1 2 | 
Ta E ES ai وم‎ (4.5) A کے‎ N(x) — n da. | 
로 n 2 | 
TA om 4 0 | 
i | | "m ده‎ e ET yx 
a ۷1 m ANE CE e RE: e p t 1 
تن‎ O proprietate necesară a testului de ajustare pentru cerc este 08 
ee E statistica folositá să fie invariantă în raport cu alegerea originii 
ma TO | CVI dedat S E (cerință satisfăcută de statistica A,), deoarece în caz contrar diferite 
i TES 2 alegeri ale originii vor da (cu acel aşi date) diferite valori pentru 
ی‎ I statistica test. 
TASTE RAT | ا‎ o RS o Wu s Testul bazat pe A, este similar testului bazat pe W? sau pe ana- 
D= پس‎ 에 n لس‎ e uc "m . D 7 is Y sj É Aut 
Ai oo Sang logul său circular Uz(Watson (1961), (1962)). O altă statistică pentru 
GT H Bu. 3 cere este V, (Kuiper (1960)). 
IEE 나 RAMANE TEKE Ud a Ba هد‎ da Punctele percentilice sînt bazate pe (Watson (1967)) 
۳ E oc că 
A = 
Ez A A E = pi Af 1 pp | 
ay AMS BE ۳ (4.6) lim P(A, > a) = y exp {— — z?*(2k — 1)? ahs 
| 10 ; سب‎ EG ~ m n= 0 bal (2k P^ 3) ㅠ 2 
om S Pentru a verifica ipoteza nulă H, conform căreia Yi Ca b. s ds 
t = zc E a provin dintr-o populaţie cu funcţia de repartitie F(y) procedem in 
1 Și = 때 felul următor 
en 2 5 (a) Caleulam 
pi o es N © > A 
| Ed 0. اه ور‎ (ae ی ول‎ e a 090) 
ii on md 
A © SS = 3 Ataner d. de < Ud. 
| ec E (b) Calculám A, cu formula 
E 7 On 2 
€ e s D n si 31 
bal ی وی‎ è ee 1 "we 2 s hd ۳ 75 
Ë E E i) (4.1) A, == ——-LF—WVYI-- یه — رت‎ (Watson (1967)) 
: 9 pa | 6 
| E + 2 4 4 Most ud | 
| g a 5, = 
<a ^ i e D» b vp x 
| e > rec c EZ A, este echivalentă cu 
یه‎ ite: شاه درل‎ v: ina 
TUE b n 2 
۳ d aen o ae (4.8) a et an 
مد‎ 4 
< ON POSH وه‎ $9 OAH te وه‎ sio „ag 7J ¥8 E 4 4 
Y nies 7 8 v ۵ < 


281 


cu 
n j-i 
(4.9) 2 = Y Y My 
j=2 i=1 
81 
Ly Xi fi 
(4.10) Mij 
L — (£; — 2), v; 


(c) Căutăm în Tabelul 4.2 în linia corespunzătoare lui n; dacă 4, 
depăşeşte valoarea găsită, respingem H, la pragul 1 ۲ 


ales. 
Obseroatie 4, Ya 


Tabelul 4.2 


1 
Ui pde 
1 
¡e ی‎ 
SĂ 


.., Yn pot fi pe dreaptă sau pe cere; dacă sint 
pe cerc, orice punct poate fi ales ca origine. 


| Pragurile de semnificaţie ca procente 
n | - - 3 
| 15,0 | 10,0 5,0 2,5 [4.0 0,5 0,1 | 
2 0,4250 0,4500 0,4750 0,4875 0,4950 0,4975 0,4995 
3 0,4519 0,5066 0,5779 0,6283 0,6730 0,6956 0,7257 
4 0,4474 0,5173 0,6168 0,6959 0,7759 0,8222 0,8960 
5 se 0,5131 0,6303 0,7289 0,8356 0,9015 1,0170 
6 — 0,512* 0,629* 0,7440 0,8706 0,9521 1,1029 
7 E 0,512 0,633 0,746* 0,883* | 0,9844 | 1,1645 
8 =- 0,512 0,636 0,753 0,897 0,998* * 
10 S 0,513 0,640 0,762 0,915 1,025 al 
12 - 0,513 0,643 0,768 0,927 1,042 — 
14 — 0,514 0,645 0,772 0,935 1,054 — 
16 ES 0,514 0,646 0,775 0,941 1,063 + 
18 aE 0,514 0,647 0,778 0,946 1,070 
20 P 0,514 0,648 0,779 0,949 1,075 - 
25 | — 0,515 0,650 0,783 0,956 1,084 — 
30 | -- 0,515 0,651 0,785 0,960 1.091 — 
40 — 0,515 0,652 0,788 0,965 1,099 — 
50 — 0,515 0,653 0,789 0,969 1,103 -— 
100 — 0,516 0,654 0,793 0,975 1,112 -— 
200 — 0,516 0,655 0,794 0,978 1,117 — 
00 0,4310 0,5156 0,6560 0,7965 0,9822 1,1226 1,3001 


În fiecare coloană, numerele date cu 4 zecimale plasate înainte 
de stelutá sint obţinute din repartiția exactă a lui Z, deci a lui 4, ; 
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LA و‎ AIN نوات‎ n یی‎ 


de asemenea si cele pentru n = oo 


+ Pompe 400 ns 


4 ۶ ۵۸۱ 


F,(2) = P(Z > 2) este dată de F(z) = 22, 0 < z< — 

thes 

F(z) = [91% 0< 2 <1 

Wie ose 
~3/ 

1,)2( EV D A 
e Sf 8 M EN 3 P B 33.3 
RR PN) (+ à 2] oH apt aa 

7 1 20000 

F,(2) = ; : 

(n — 1)? (2(n — 2)... {k(n — k))? 
| 1 
(o DIE lo n — x pentru n = 2k + 1) - 
Fale) ae s. de 
(n — 1)? {2(m — 2))?... ((k — 1) (n — k + 3? k(n — ky)’ 
1 
0 > ۵ < — 0 سب‎ A pentru n = 21) 


Pentru n = 1,7 = 0 şi A, 
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CAPITOLUL 14 


"ESTE DE TIP SHAPIRO 


1, Introducere 


În acest capitol ne vom ocupa de teste bazate pe statistici de 
forma l 


n 2 
( X. m 


t=1 


(1.1) W == 
회 (Y, — £y 
=1 


unde Xıg< Y, < +... < Xa, sint statisticile de ordine corespunzá- 


toare unei selecţii X,, X,, ...,.Y, asupra unei variabile X avind 
funcţia de repartiție F(x), iar din, ..., Gun Sint constante alese in mod 


convenabil. 

Mai multe teste de concordanță au statisticile test de aceasta, 
formă sau statisticile test corespunzătoare lor pot fi scrise în această 
formă. Statisticile obţinute una din cealaltă printr-o transformare 
strict monotonă determină unul 81 acelaşi test. 

Vom prezenta rezultatele obţinute de Shapiro, Wilk (1965), 
(1972), Shapiro, Francia (1972) şi Hahn, Shapiro (1967) privind 
testele de normalitate si exponentialitate. 


2. Testul Shapiro-Wilk (1965) pentru normalitate 


Ne propunem să verificăm ipoteza conform căreia o selecţie de 
volum ~ provine dintr-o populaţie caracterizată de o variabilă alea- 
toare repartizată Nína, 02). Fie ya statistica de ordine de rang? din 
această selecţie, 


Ya > Yo > ۰۰۰ > o) 


şı y vectorul coloană a cărui componentă de ordin î este Yw- 
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۱9999: 73 rra 


Fie m, valoarea medie a statisticii de ordine de rang i وه‎ a 
unei selecţii de volum n dintr-o populaţie caracterizată de o variabilă- 
aleatoare repartizată N(0, 1) si m vectorul coloană de componente: 
m (t= 1, 2, ...,n). Presupunem că v = cov (245, 45) si că V 

= (04) este matricea de covariante, Estimatorul de cele mai mici 
pătrate pentru 6 este 
5 = m'V-!y/m'V -! m, 


unde m' este transpusa vectorului m. 
m „Statistica Shapiro-Wilk pentru normalitate este multiplu de 
c?/s*, unde s? = Y (yo — y)?/(n — 1) este estimatorul | nedeplasat 
pentru o”. 

Mai precis, statistica W are expresia 


R6? 


(2.1) "n i a e ditt 
(n — 1) 820? 


unde 
Re == NEV m, 0? ma VW rue 


Cu notația 


W capătă forma 


(> AY o ۱ 
dl 


x (Ya) y)? 


1 


(2.2) W 


coeficienții a, fiind tabelati (Sarhan, Greenberg (1956)) 

Teorema 2.1. (Shapiro, Wilk (1965)). Statistica W se bucurá de 
proprietățile 

a) este invariantá la factorii de pozitie si de scară 

b) repartiția sa depinde de volumul selecției si este independentă 
de (n — 1) s? gi y 

c) pentru , orice r, MW" = Mb*/M|[(n — Y)s?]*, b = R26/0 


d) are valoarea minimă na?/(n — 1) 
aes RI ) 
e) MW?— RI ) ۳-2 M(W)= R?( R?--1)/C?(n —1) 


f) repartitia comună ce contine pe W este 
í 7 ^ = - 2 -— 8 
AW, s, 4) UR t UN i W AED 6 JAR COTO: toe Bic, pe 
regiunea T pe care (0,) şi W nu sint independente si unde K 
este o constantă. 
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Tabelul 2.2 
Punctele percentilice ale testului W pentru n — 3(1)50 


Deoarece V este tabelată exact (Sarhan, Greenberg, (1956) Pragul de semnificatie 


: ab ra D U A 
numai pentru n < 20, Shapiro, Wilk reprezintă grafie R? si C 


ca, functie de 72 si găsesc aproximatiile : n | 0,01 0,02 | 0,05 | 0,10 | 0,50 | 0,90 0,95 | 0,98 |. 0,99 
l i | 
n ۲ Q, | | 
R? = —2,411 + 1,981 n, C? = — 2,722 + 4,083 n 3 | 0,753 | 0,756 | 0,767 | 0,789 | 0,959 | 0,998 | 0,999 | 1,000 | 1.000 
مه‎ PE ME ini la 50 4 | 0,687 | 0,707 | 0,748 | 0,792 | 0,935 | 0,987 | 0,992 | 0,996 | 0.997 
care pot fi folosite pentru » pină la 50. natrieii V sint 5 | 0,686 | 0,715 | 0,762 | 0,806 | 0,927 | 0,979 | 0,986 | 0,991 | 0.993 
Pentru valori mari ale lui n, elementele matricii sin 6 | 0,713 | 0,743 | 0,788 | 0,826 | 0,927 | 0,974 | 0,981 | 0.986 | 0.989 


o6 


i j 7 0,730 | 0,760 | 0,803 | 0,838 | 0,928 | 0,972 | 0,979 | 0.985 0,988 
pi CES it da) 0,749 | 0,778 | 0,818 | 0,851 0,972 | 0,978 | 0,984 0,987 
n +1 n +1 


(2.3) 9 0,764 | 0,791 | 0,829 | 0,859 | 0,972 | 0,978 | 0,984 0,986 


Vu TO PAER TP TER y 10 0,781 | 0,806 | 0,842 | 0,869 | 0,938 | 0,972 | 0,978 | 0,983 0,986 

(n + 2) (m) p(m,) 79: 7 | 6.85 76 ).97: Da 

11 | 0,792 | 0,817 | 0,850 |'0,876 | 0,940 | 0,973 | 0,979 | 0,984 | 0,986 
si j 12 | 0,805 | 0,828 | 0,859 | 0,883 | 0,943 | 0,973 | 0,979 | 0,984 | 0.986 
mi ; 13 | 0,814 | 0,837 | 0,866 | 0,889 | 0,945 | 0,974 | 0,979 | 0,984 | “0.986 

W PUR N me i a) 14 | 0,825 | 0,846 | 0,874 | 0,895 | 0,947 | 0,975 | 0,980 | 0,984 |. 0.986 
(2.4) Pn) | e) Hai 15 | 0,835 | 0,855 | 0,881 | 0,901 | 0,950 | 0,975 | 0,980 | 0,984 | 0.987 
E 16 | 0,844 | 0,863 | 0,887 | 0,906 | 0,952 | 0,976 | 0,981 | 0,985 | 0,987 


7 0,851 | 0,869 | 0,892 | 0,910 | 0,954 | 0,977 | 0,981 | 0,985 | 0.987 
18 | 0,858 | 0,874 | 0,897 | 0,914 | 0,956 | 0,978 | 0,982 | 0,986 | 0.988 
19 0,863 | 0,879 | 0,901 | 0,917 | 0,957 | 0,978 | 0,982 | 0,986 | 0,988 
20 0,868 | 0,884 | 0,905 | 0,920 | 0,959 | 0,979 | 0,983 | 0,986 | 0.988 


n — [n 1 21 0,873 | 0,888 | 0,908 | 0,923 | 0,960 | 0,980 0,983 | 0,987 0,989 
r( ۳" rail n« 20 | 


Pentru که‎ = m'V-1, Shapiro, Wilk sugerează aproximatiile 


w A 4 EIS ud 0 
(2.5) AE MS odd S QA N 1 


22 0,878 | 0,892 | 0,911 | 0,926 | 0,961 | 0,980 | 0,984 0,987 0,989 


2 2 23 0,881 | 0,895 | 0,914 | 0,928 | 0,962 | 0,981 | 0,984 | 0,987 | 0,989 

~ MULT NM 24 0,884 | 0,898 | 0,916 | 0,930 |. 0,963 | 0,981 | 0,984 | 0,987 | 0,989 

e 2h d 25 0,888 | 0,901 | 0,918 | 0,931 | 0,964 | 0,981 | 0,985 | 0,988 | 0,989 

rí( 5*1 Var{— +1 ,n 20. 26 | 0,891 | 0,904 | 0,920 | 0,933 | 0,965 | 0,982 | 0,985 | 0,988 | 0,989 

2 9 27 0,894 | 0,906 | 0,923 | 0,935 | 0,965 | 0,982 | 0,985 | 0,988 | 0.990 

p is d ۱ 28 0,896 | 0,908 | 0,924 | 0,936 | 0,966 | 0,982 | 0,985 | 0,988 | 0.990 

Valorile necesare ale mediilor m; pentru aceste aproximatii se găsesc 29 0,898 | 0,910 | 0,926 | 0,937 | 0,966 | 0,982 | 0,985 | 0,988 0,990 
/ d : 912 27 939 „985 98: 

in Harter (1901), RW EE ees OR Ped ed eae Bed ee 

711 s istica Y int necesari coeficienţii (a;;, deci coefi- 0, € } 2f M à „98: A ,98 „990; 

i مرو‎ unido ig sint i A 3 0,904 | 0,915 | 0,930 | 0,941 | 0,968 | 0,983 | 0,986 | 0,988 | 0.990 

cientii (a; normalizati. 33 0,906 | 0,917 | 0,931 | 0,942 | 0,968 | 0,983 | 0,986 | 0,989 | 0.990 

Tabelul 2.1 l 34 0,908 | 0,919 | 0,933 | 0,943 | 0,969 | 0,983 | 0,986 | 0,989 0,990 

A Q5 D D a 3 » 

O comparaţie între a; şi a; | 35 0,910 | 0,920 | 0,934 | 0,944 | 0,969 | 0,984 | 0,986 | 0,989 0,990 

j 36 0,912 | 0,922 | 0,935 | 0,945 | 0,970 | 0,984 | 0,986 | 0,989 | 0,990 

10000 37 0,914 | 0,924 | 0,936 | 0,946 | 0,970 | 0,984 | 0,987 | 0,989 | 0990 

T5 ۳ ativ > > > > , , > , 

n Exact | Aproximativ n pues | Shs thie 38 | 0,916 | 0,925 | 0,938 | 0,947 | 0,971 | 0,984 | 0,987 | 0,989 | 0.990 

39 | 0,917 | 0,927 | 0,939 | 0,948 | 0,971 | 0,984 | 0,987 | 0.989 0,991 

| | 287 0,283 40 | 0,919 | 0,928 | 0,940 | 0,949 | 0,972 | 0,985 | 0,987 | 0,989 | 0.901 

6 0,414 ` 0,426 y: ee 0:272 41 | 0,920 | 0,929 | 0,941 | 0,950 | 0,972 | 0,985 | 0,987 | 0,989 0,991 

7 0,388 0,392 i Di Sus 0:261 42 0,922 | 0,930 | 0,942 | 0,951 | 0,972 | 0,985 | 0,987 | 0,989 | 0,991 

0,991 0,990 | 0,987 | 0,985 | 0,973 | 0,951 | 0,943 | 0,932 | 0,923 43 0,254 0,9256 و 0308 2 

9 0,347 gras e 0/247 0 245 l 44 0,924 | 0,933 | 0,944 | 0,952 | 0,973 | 0,985 | 0,987 | 0,990 | 0.991 

10 0,039 pad i 9,239 0,237 45 0,926 | 0,934 | 0,945 | 0,953 | 0,973 | 0,985 | 0,988 | 0,990 | 0.991 

E d 0,295 19 0,231 0,231 46 0,927 | 0,935 | 0,945 | 0,953 | 0,974 | 0,985 | 0,988 | 0,990 | 0,991 

12 ^ | , | 20 0 224 0,226 47 0,928 | 0,936 | 0,946 | 0,954 | 0,974 | 0,985 | 0,988 | 0,990 | 0.991 

É i 48 | 0,929 | 0,937 | 0,947 | 0,954 | 0,974 | 0,985 | 0,988 | 0,990 | 0.991 

Se observă că eroarea relativă este < 1%. j 1 49 | 0,929 | 0,937 | 0,947 | 0,955 | 0,974 | 0,985 | 0,988 | 0,990 | 0,991 

Cuantilele statisticii W (tabelul 2.2) au fost obţinute prin apro- | 50 0,930 | 0,938 | 0,947 0,955 | 0,974 | 0,985 | 0,988 | 0,990 | 0,991 


ximarea repartitiei empirice a statisticii W prin sistemul de curbe 
| 287 
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introduse de Johnson (1949) prin transformarea 


ake [^ E: 1 
Y + 8g 
7 


= 


unde parametrii si funcția g(.) sînt aleşi astfel incit E~ N (0, 1) 
Johnson consideră sistemele 
i) sistemullognormalS,: g(2) = In a æ € (0, 00) 


ii) sistemul S5 
iii) sistemul Sy 
Pentru a calcula 
etape : 
i) scriem obser 


paki ها‎ cay 
Hila es shty; 


valoarea statisticii W parcurgem următoarele 


rațiile în ordine crescătoare si notăm statisticile 


de ordine astfel obţinute prin %1, Ya, ¿Un 
1i) calculám 
* E: Ld 
8 = 회 (e =g) = Y (a - 203 
1 1 


iii) a) dacă n este par 


(M2 
k 
"m Y Os — i41 e41 


t=1 


k), caleulám 


(2.6) — yi) 
unde valorile constantelor n i sint date in tabelul 2.3 
b) dacă n este impar (n = 2 k + 1), avem de efectuat acelaşi 
calcul ca la punctul a) deoarece ودره‎ = 0 cînd n = 2k +1 
Găsim 
(2.7) b = ,م0‎ — Ya) + ys) 


unde valoarea medianei de selecţie (24) nu intră în calculul coefi- 
cientului b. 

iv) ealeulám W = eae: 

Cuantilele de ordin 1, 2, 5, 10, 50, 
statisticii W sînt date în tabelul 2.2. 

Observaţie. Dacă două observaţii au o valoare comună, adică 
dacă y, = Yi+1, S-a sugerat ca amindouá să fie multiplicate prin 


d- 


+ packen — 
90, 95, 


95, 99 ale repartitiei 


1 
= (a;--a;41), însă pind acum nu و‎ 


ys 


s-a făcut niei un studiu privind efec- 
tul acestei multiplicări. 

Valorile mici ale lui W indică normalitatea. 

Exemplul 2.1. În tabelul 2.4 sînt trecute rezistentele (in kQ) 
a 18 tronsoane de ceramică acoperite cu carbon. 


Tabelul 4 


1,65 1,72 1,70 1,84 1,96 1,58 1,85 1,78 1,88 
1,75 1,92 1,60 1,75 2,05 1,90 1,76 1,82 1,68 
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Tabelul 2.3 
Coeficientii (a, ;,,) pentru testul de normalitate W pentru n == 2(1)50. 


~ + dll er 


AAN e 


n هرق ره‎ 08” CHA) 'IBNBE BLA Y AF PP, IND, IT ۲ 
i 6,7071 0,7071| 0 jeg 0, „cecul 0,6431 0,6233| 0,6052| 0,5888| 0,5739 
2 — | 0,0000! 0, 1077 0 2413) 0,2800, 0,3031| 0,3104| 0,3244| 0,3291 
3 uat. md o ,0000| 0,0875| 0,1401| 0,1743| 0,1976] 0,2141 
4 = Lah ی‎ En — | 0,0000} 0,0561| 0,0947 0,1224 
S MAT a dd Ion | - — | 0,0000! 0,0399 
NUT POTENT"! | | | | | 
(mi , | 1 | i | hs | | « 
| 11 12 | ipu 00] 180p CLD d | 18 | 19 20 
he la că O OA y | | | 
| 
1 | 0,5601| 0,547 o,5251| 0,5150| 0,5056| 0,4968| 0,4886 0,4808 0,4734 
2 | 9,3315] 0,332 3325| 0,3318| 0,3306| 0,3290| 0,3273| 0,3253| 0,3232] 0,3211 
3 | 0,2260] 0,2347 012412 0,2460, 0,2495| 0,2521] 0 12540 0,2553| 0,2561| 0,2565 
Ip 01586| 0,1707| 0,1802| 0,1878| 0.1939| 0,1988, 0,2027| 0,2059| 0,2085 
5 | 0,0695 0,0922 0,1099] 0,1240| 0,1353. 0,1447, 0,1524] 0,1587 0,1641| 0,1686 
6 | 0,0000! 0, 0308} 0,0539| 0,0727) 0,0880| 0,1005| 0,1109| 0,1197 271| 0,1334 
7 | A | | 0,0000| 0,0240| 0,0433| 0,0593| 0,0725| 0,0837| 0,0932| 0,1013 
8 | Wan. | - |  - | 0,0000| 0,0196| 0,0359] 0,0496| 0,0612] 0,0711 
9 UPA a | A e | d 9 ۳ 0,0163| 0,0303| 0,0422 
oj | = ~) 300 -- - | - | 0,0000 0,0140 
AA | 1 | BER HG REP MTR Mer Aaa Tr mt 
obo a dora do deii Mn ap 26 97۱۷۷۷۷ ۵ 30 
| | | | | | 
۱ { | | 
1 | 0,4643| 0,4590] 0,4542] 0,4493] 0,4450| 0,4407] 0,4366| 0, 4291 0,4254 
2 | 0,3185] 0,3156| 0,3126| 0,3098| 0,3069| 0,3043| 0, 3018| 0,2903 0,2944 
3 | 6,2578| 0,2571] 0, aa 0,2554| 0,2543| 0,2533] 0,2522 ,2499| 0,2487 
4 | 0,2119| 0,2131| 0,2139| 0,2145| 0,2148| 0,2151| 0,2152 ași 50| 0,2148 
5 | 0,1736| 0,1764 071787) 0,1807, 0,1822] 0,1836| 0,1848| | 0,1864| 0,1870 
6 | 0,1399| 0,1443| 0,1480| 0,1512| 0,1539| 0,1563| 0,1584] 0,1601| 0,1616| 0,1638 
7 | 0,1092] 0,1150 0,1201] 0,1245| 0,1283| 0,1316| 0,1346| 0,1372| 0,1395| 0,1415 
8 | 0,0804| 0,0878| 0,0941| 0,0997| 0,1046] 0,1089 0,1128 0,1162] 0,1192] 0,1219 
9 | 0,0530! 0,0618] 0,0696| 0,0764] 0,0823| 0,0876| 0 ,0923| 0,0965| 0,1002! 0,1036 
10 | 0,0263| 0,0368| 0,0459| 0,0539 0,0610! 0,0072| 0, 0728| 0,0778| 0,0822! 0,0862 
11 | 0,0000| 0,0122| 0,0228) 0,0321| 0,0403| 0,0476| 0,0540| 0,0598 0,0650! 0,0697 
12 سد‎ $ 0,0000) 0,0107| 0,0200| 0,0284| 0 ,0358| 0,0424| 0,0483 0,0537 
13 -| - | - — | 0,0000| 0,0094! 0,0178| 0,0253| 0 어어 0,0381 
14 개. ey Ji Br | de | 0 ,0000| 0,0084| 0,0159, 0,0227 
15 A در‎ | E S) NS c] OS - | — 10,0000| 0,0076 
Vh addon. 4 | 35 | 36 | 37 | 38 | 39 | 40 
NI | | | | | | | 
i | 0,4220] 0 n" 0,4156| 0,4127| 0,4096| 0,4068| 0,4040| 0, 4045] 0, 3989| ó „3964 
2 0,29: 21| 0,2898| 0,2876 apr 0,2834] 0,2813] 0,2794] 0,2774| 0,2755] 0,2737 
3 | 0'2475| 0,2463] 0,2451] 0,2439] 0,2427] 0, 2415| 0,2403| 0,2391 0,2380| 0,2368 
4 912145 0,2141| 0,2137| 0,2132| 0,2127| 0,2121| 0,2116! 0,2110| 0,2104| 0,2098 
5 | 0,1874] 0,1878| 0,1880| 0 0/1882] 0,1883| 0,1883| 0,1883| 0,1881| 0,1880] 0,1878 
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Tabelul 2.3 (continuare) 


ho E SE A MNS 2s A asc Ms UN Mc: 40 
۲ ۱۱ ۱ | | | | | | 
j FB ACE ——————s— — À—— WDR 
} | | | | 1 
6 | 0,1641| 0,1651| 0,1660] 0,1667] 0,1673| 0,1678] 0,1683 0,1686| 0,1689 
7 | 0,1432] 01449 0,1463] 0,1475 0,1487| 6۰14961 0,1505 0,1513| 0,1520 
8 | 0,1243 0,1265| 0,1284| 0,1301 0,1317) 0,1331] 0,1344| 0,1356| 0,1366 
9 | 0,1066| 0,1093| 0,1118| 0,1140| 0,1160, 0,1179| 0,1196| 0,1211] 0,1225 
10 | 0,0899] 0,0931| 0,0961| 0,0988| 0,1013| 0,1036| 0.1056| 0,1075| 0,1092| 0, 
ik | ci | | | | : | 
11 | 0,0739 0,0777| 0,0812| 0,0844| 0,0873| 0,0900| 0,0924| 0,0947| 0,0967! 0, 
12 | 0,0585, 0,0629 0,0669| 0,0706| 0,0739 0,0770| 0,0798| 0,0824 0,0848| 0,0 
13 | 0,0435 0,0485| 0,0530) 0,0572| 0,0610| 0,0645| 0,0677| 0,0706| 0,0733| 0 
14 | 0,0289| 0,0344] 0,0395| 0,0441| 0,0484| 0,0523| 0,0559| 0,0592| 0,0622] 0 
15| 0,0144| 0,0206| 0,0262| 0,0314] 0,0361] 0,0404| 0,0444| 0,0481|-0,0515| 0,0546 
16 | 0,0000| 0,0068! 0,0131| 0,0187| 0,0239| 0,0287| 0,0331] 0,0372 0,0409| 0,0444 
17 - | = | 0.0000 0,0062| 0,0119| 0,0172| 0,0220| 0,0264| 0,0305| 0,0343 
18] .= | — | ENT - | 0,0000| 0,0057| 0,0110| 0,0158, 0,0203| 0,0244 
19 S EP sie e tol qe : 0,0000| 0,0053| 0,0101| 0,0146 
Be ی‎ Ry HY MOSS bes Ti A 0,0000| 0,0049 
| ) | | j ) | 
۱ 1 | | 1 ; 
n | ; NI | 
۱ 41 ۱ 42 4 45 | 46 47 48 | 49 50 
AN | | ات یا‎ c 
I 0 1 
1 | 0,3940| 0,3917| 4 03 0,3830| 0,3808| 0,3789 0,3770| 
2 | 0,2719| 0,2701| 0,2684| 0,2667| 0,2651| 0,2635| 0,2620| 0,2604| 0,2589 
3 1 0,2357| 0,2345] 0,2334] 0,2323] 0,2313| 0,2302 ; 0,2281| 0,2271 
4 | 0,2091| 0,2085| 0,2078| 0,2072! 0,2065| 0,2058 | 0,2045| 0,2038 
5 | 0,1876 0,1874] 0,1871| 0,1868| 0,1865| 0,1862 0,1855| 0,1851 
| | | 
6 | 0,1693| 0,1694| 0,1695| 0,1695] 0,1695| 0,1695| 0,1695| 0,1693| 0,1692] 0,169 
7 10515311 535| 0,1539] 0,1542| 0,1545! 0,1548] 0,1550| 0,1551 0,15 
8 | 0,1384| 0,1392, 0,1398| 0,1405| 0,1410| 0,1415| 0,1420] 0,1423 ), 143 
9 | 0,1249| 0,1259| 0,1269] 0,1278] 0,1286| 0,1293] 0,1300| 0,1306 0,1312) 0,13 
10 | 0,1123| 0,1136, 0,1149| 0,1160| 0,1170| 0,1180| 0,1189] 0,1197| 0,1205] 0,12 
| | | | | 
11 | 0,1004, 0,1020| 0,1035| 0,1049| 0,1062] 0,1073| 0,1085| 0,1095| 0,1105| 0,111 
12 | 0,0891| 0,0909| 0,0927| 0,0943| 0,0959| 0,0972| 0,0986| 0,0998| 0,1010| 0,1020 
13 | 0,0782| 0,0804| 0,0824| 0,0842| 0,0860| 0,0876| 0,0892| 0,0906| 0,0919| 0,0932 
14 | 0,0677| 0,0701| 0,0724| 0,0745| 0,0765| 0,0783| 0,0801] 0,0817| 0,0832| 0,0846 
15 | 0,0575| 0,0602} 0,0628| 0,0651| 0,0673| 0,0694| 0,0713 0,0731| 0,0748| 0,0764 
| | 
16 | 0,0476 0,0506| 0,0534 0,0560| 0,0584] 0,0607| 0,0628] 0,0648| 0,0667| 0,0685 
17 | 0,0379| 0,0411| 0,0442| 0,0471| 0,0497| 0,0522 0,0546| 0,0568 0,0588] 0,0608 
18 | 0,0283| 0,0318 2| 0,0383| 0,0412] 0,0439| 0,0465) 0,0489| 0,0511| 0,0532 
19 | 0,0188] 0,0227| | 0,0296| 0,0328| 0,0357| 0,0385| 0,0411| 0,0436| 0,0459 
20 | 0,0094 0,0136| 0,0175| 0,0211| 0,0245, 0,0277| 0,0307| 0,0335| 0,0361| 0,0386 
| | | | | | 
| | 
21 | 0,0000| 0,0045| 0,0087| 0,0126| 0,0163| 0,0197| 0,0229| 60,0259] 0,0288| 0,0314 
22 pa — | 0,0000| 0,0042| 0,0081| 0,0118| 0,0153| 0,0185|-0,0215| 0,0244 
23 E ob rd - | 0,0000| 0,0039| 0,0076| 0,0111| 0,0143| 0,0174 
24 | = fei nl = | d pv — | 0,0000| 0,0037 0,0071| 0,0104 
25 | | j | $ ارت‎ - — | 0,0000| 0,0035 
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Aceste tronsoane provin de la un cuptor de 0,5 W ; au fost decapate 
in soluţia 1—4—10 si la piroliză s-a folosit amestecul 1/3 (metan/ 
/azot). Temperatura în cuptor a fost de 1100°C, măsurătorile execu- 
tindu-se la 15 minute după scoaterea din cuptor. 

Ne propunem să verificám, la un prag de semnificaţie a = 0,05, 
ipoteza conform căreia rezistenţa ohmică este o variabilă repartizată 
normal. 

Primele 9 observaţii în ordinea mărimii au fost trecute în coloana, 
a treia a tabelului 2.5, celelalte 9 observaţii au fost trecute în coloana 
a doua a aceluiași tabel, începînd de jos în sus. Hlementele coloanei 
a 5-a sint extrase din tabelul 2.3. 

Din ultima coloană obţinem 


9 
b= Y a, 44. Wi) = 0,51941 = 0,52 


t=1 


Deci statistica are valoarea 0,985 


| | | | 
; T(n 141) | T | Wu [LE EET | 85 443 PU) 
| | | 
| | | 
1 2,05 | 1,58 0,47 0,4886 | 0,229642 
2 1,96 | 1,60 || 0,36 0,3253 | 0,117108 
3 1,92 | x1 0,27 | 0,2553 | 0,068931 
Pon bs A AR a 0,2027 | 4 
SS e E end TO 0,18 0,1587 | 0,028536 
6 1,85 | 1,71 0,14 0,1197 | 0,016758 
7 1,844) 1,72 0,12 0,0837 | 0,010044 
8 10011 A O AR DE 0,0496 | 0,003472 
9 1,78 | 1,76 ㅣ 0,02 | 0,0163. | 0,000326 
Din tabelul 2.2. găsim Wie; 0,95 = 0,982 si cum W > Wis; 0,95 


acceptăm ipoteza de normalitate. 


3. Testul Shapiro-Hahn (1967) pentru exponentialitate 


Pentru verificarea ipotezei conform căreia X,, X,, ..., X, este 
o selecţie asupra unei variabile exponentiale de densitate 


2۵-, t> 0, A>O 


Shapiro-Hahn (1967) folosesc statistica 


Si acceptă ipoteza de exponentialitate dacă 
(val. tabelatá) sr > )۲۷ مریم( و19‎ < (val. tabelata) sup, 
la pragul de semnificatie ales. 
Tabelul 3.1 


| 95% | 99% 

أ 
n .| ery | wr | wr) (V.T.)‏ 

| inf. sup. | inf. sup. 

i Li 

| 
7 0,025 0,260 0,033 0,225 
8 0,025 0,230 0,032 0,200 
9 0,025 0,205 0,031 0,117 
10 0,025 0,184 | 0,030 0,159 
11 0,025 0,166 0,030 0,145 
12 0,025 0,153 0,029 0,134 
13 0,025 0,140 0,028 0,124 
14 0,024 0,128 0,027 0,115 
15 0,024 0,119 0,026 0,106 
16 0,023 0,113 0,025 0,098 
17 0,023 0,107 0,024 0,093 
18 0,022 0,101 0,024 0,087 
19 0,022 0,096 0,023 0,083 
20 0,021 0,090 0,023 0,077 
21 0,020 0,085 0,022 0,074 
22 0,020 0,080 0,022 0,069 
23 0,019 0,075 0,021 0,065 
24 0,019 0,069 0,021 0,062 
25 0,018 0,065 0,020 0,058 
26 0,018 0,062 0,020 0,056 
27 0,017 0,058 0,020 0,054 
28 0,017 0,056 0,019 0,052 
29 0,016 0,054 | 0,019 0,050 
30 0,016 0,053 | 0,019 0,048 


Exemplul 3.1. Următoarele date reprezintă timpii dintre defee- 
„tele unui subansamblu al unui sistem central 1, 4, 5, 6, 15, 20, 40, 
40, 60, 93, 95, 106, 125, 151, 200, 268, 459, 827, 340, 1089. Ne pro- 
punem sá verificám ipoteza conform cáreia acesti timpi de defectare 
pot fi consideraţi ca o selecţie asupra unei variabile exponentiale 


70 Ug 
Avem X = 222,2, Y (Xi — X)? —='1985337/2 
1 


20 2 
(Y x) = (49372,84) 400 — 19749136 
de unde 
í 11985337,2 
19749136 


Din tabelul 3.1 rezultă că vom respinge ipoteza de exponentialitate 
atit la pragul de semnificaţie de 5% cit şi de 1%. 


WE, = — 0,1005278 
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Mog co MERE papa. 


4. Testul Shapiro-Wilk (1972) pentru exponentialitate 


Fie a > وه‎ < ...< x, statisticile de ordine corespunzătoare 
unei selecţii de volum n asupra unei variabile repartizate exponen- 
tial cu densitatea 


Fie m, valoarea medie a statisticii de ordine de rang i si m vectorul 
de componente mi = 1, 2, ..., m) Presupunem că Uy = 
= eov(z; j) si V = (t;) este matricea de covariante. Avem 


i 


Lc sedi DA Au a alk RUN i 38 D HUE 
paza 
i 
$57 y (nc dye E 
۸-1 
고 
By + (mc e Jp) ed > 
k=1 


Fie y' — (Yı, ...,9,) veetorul statisticilor de ordine. Dacă $,, ..., 
Y, Sînt statisticile de ordine corespunzătoare unei selecţii de volum 
n asupra unei variabile repartizate exponential cu densitatea 


1 
(4.1) — exp[— (u= 0,)/0,], u 2 0 
0 2.1) 1 


9 
atunci 


DMA lu e he LATI o id 


Estimatorul de cele mai mici pătrate pentru f este 

n n 

MY — Y1)/(n — 1), unde y = Y, y/n, iar statistica Bhapiro- Wilk‏ = دا 
1 

(1972) pentru exponentialitate : 


(4.2) W = n(y — (2/0 — 1) 82. 


Teorema 4.1. (Shapiro, Wilk (1972)). Statistica W se bucură de 
proprietățile 

a) este invariantá la factorii de pozitie si scală 

b) repartiția sa este independentă de y, si y si depinde numai de 
volumul selecției n 

e) are valoare minimă (n — 1)-? si valoare maxima 1 

d) W evaluat în valorile medii ale statisticilor de ordine este 


(4,2) W= (n — (m AY i), 


t=] 
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۱ ۲ ka aii i mie m ve 


Tabelul 4.1 


" E WS " à E Puneteie percentilice ale statisticii W (Exponentialitate 
Astfel valoarea statisticii W pentru o selecţie dintr-o populaţie y alitcr Wil wc ears 


exponențială este depărtată atit de valoarea minimă 1/(n — 1)? WE | 1 ۳ fe are eT o A T Ie TE D FIR 
cît şi de valoarea maximă 1. Aceasta sugerează că ambele cozi ale n [0,050 | 0,01 [0,025 | 0,05 | 0,10 | 0,50 | 0,90 | 0,95 [0,975 | 0,99 | 0,995 
d Ty AD AVAL SEC 2 AT Sen A n 1 y | | | 
repartitiel statisticii W ar trebui folosite in stabilirea ipotezei com- | | ۱ ! ۱ 
k : : 4 : | . | 
se de exponentialitate. | ) 0 
dote Eie ; 2 ge | و‎ dei! f 3 |0,25190,2538/0,2596 0,2697 0,2915 0,5714 0,9709 0,9920 0, 0081 0,099715, 99939 
LEM PLU e propunem să verificam ipoteza nulă conform 4 10,124110,1302|0,143410,1604|0,189110,3768|0,751410, 8581/0, 9236/0, 96800,9837 
cáreia selectia 5 |0,0845]0,0905|0,1048]0,1187/0,1442 [0,28750 : 55470 , 6682.0, 7590/0, 8600/0 ,9192 
Dara es Gg gU Loe" 91 6 |0,0610/0,0665]0,0802]0 ,0956]0 , 1173| j|0, 429210, 508910 , 5842/0, ۵77510 , 7501 
atia 9 ah ا‎ 7 |0,0514/0,0591]0,0700/0 ۱081010 ,0986/0 , 1874/0 ,3474/0 , 4162 ,5706/0,6426 
E Au e cO MA în ANS atero 0 i : 8 |0,0454|0,0512/0,0614]0,0710]0 ,0852]0 , 1625/0 , 29 o, 349710, ), 484810 5428 
rovine dintr-o populaţie exponențială cu originea si scala nespeci- ۳ > Aa , pate > > , 
Eo os " تخل وک‎ pie E UT abad: 9 |0,0404/0,0442|0,0537|0 ,0633]0 ,0751 0, 14150, 2553/0, 2005 "401510, 
ficate. Procedám în felul următor AS - 10 0,0369/0,0404/0,0487|0,0568/0,0678/0 , 1295/0 ,: in. 25028790 3391 0,3; 
1) Cea mai mică observaţie este y, = — T. Media observaţiilor 11 ]|0,0339/0,0380|0,0447]0,0528|0,06106/0,1112| 0, 2265/0 ,2619]0 , 303910 , 3: 
este y 21/7 — 3 l 12 10,031110,9358|0,0410|0,0494|0,0567l0,1009 ),2019/0,2364/0,2716|0,: 
: ^ 13. |0,0287/0,0337|0,03820,0460/0,0528/0,0925|0,1563|0,1829]0,21130, 2422/0 .: 
SE Y typ 9)? 826 14 [0,0265/0,0317/0,0362/0,0428|0,0496/0,0847|0,1417/0,1647|0,1862|0,2131/0, 
ai / 15 [0,0247/0,0298|0,0344/0,0398/0,0466/0,0778l0,1285|0, 1485 0,1669/0,1926/0,: 
i: 16 |0,0233/0,0280/0,0326|0 , 037410 , 043810 , 072810 ,118710 , 0,154210 1770/0, 
8 100 17 00222 0,0264 0,0310 0:0352 0,0412 00684 0,1090 0:1257 0,142 016140, 1 
ii) W n(y — ¥,)2/(% — 198? = -—.—-— = 0,350. 18  |0,0212/0,0250/0,0294/0,033210,0388/0,0640 3410 ,1311/0, 148310, 
T 326 19 |0,020310 ,0238 0,0278/0,031410,0368|0.,0600 ¢ 0,119910,1374 
în a tipla x Tore Wa ug 5 20 [0,0196|0,0227|0,0264|0,0302|0,0352|0,0570|0, 0884 0 100210 , 112110 , 128610, 
Din tabelul 4.1 se găseşte că această valoare este sub 97,50 > > , , , , , , [os 
Pp gi es ee E i T tisi ۱ TIGR es s /o 21  [0,0190/0,0217/0,0250/0,0290|0,0337/0,0540|0, ,0839/0,0948/0,1054/0,1198|0. ; 
punc tul perc enu 1c. Deoarece această statistică este folosită ca ALA 22 . و10‎ 01860 020810 , 0238/0 02780 ,0323 0,051610 . 0794l0 ,0894 0,0988/0, 1118/0, 1: 
a unui test bilate ral, pragul de semnificaţie asociat cu W — 0,350 23 0,0181/0,0201/0,0230/0,0266|0,0310]0 ,049210 ,0749/0,0836/0 ,0933l0 , 104310, 
va fi aproximativ 5%. Astfel nu vom putea respinge ipoteza de expo- 24 [0,0177/0,0194/0,0224/0,0256/0,0298/0,0468/0, 0704/0,0788|0,0882/0,0984|0, 
nentialitate 25  |0,0173[0,0188|0,0218|0,0248/0,028610.,0447/0.,0668 8/0,0749/0,0836/0,0927| 
Malitate. | 26 |0.016910,018910,021310,0240|0,027410,0426|0.0636|0.0212|0 .079110 08 5 
27 |0,0165]0,0177,0,0208/0,0232/0,0264/0 0407/0 ,0606/0 ,0678|0 ,074 0, 
pup we TM 28 |0,0161/0,0172/0,0203|0,0225|0,0256/0,0391]0,0576/0 ,0649]0 0706/0 , 080110 , 
A Tanti K 8 an i J [v5 | | | 
9. Testul Shapiro-Francia (1972) 29 10,0157]0,0168]0.0198]0 021910. 0249 /0,0377/0,0555/0,0621|0,0671/0/0759|0,0 
> 4 Y mon 인 PUER 30 |0,0153/0,016410,0193/0,0213/0; 0,0364/0 0536/0 ,0593/0 ,0643|0 ,0719| 
Pentru a arăta, că funetiile de repartiție F(x) si G(x) pot diferi 31 [0,0149|0,0160/0,0188|0,0207/0, 10,0352/0,0518|0,0569/0,0615/0,0686/0,0 
numai pri! ۱ parametrii de pozi tie 31 scală, adică există două constante 32 10,0145/0,0156/0,0183/0,0201|0, 9/0, 0340)0 , 0491۱0 054710 059110 , 066110, 
; 33 10,0 52 78/0,0195/0,0223/0,0329|0,0475]0,0527|0,0573/0 ,0636]0 , 06t 
a 0 siib Sal incit pentru toate valorile x, Flas + b) = G(s), 33 [0,0141/0,0152/0,0178/0,0195|0,0223/0,0329/0,0475|0.0 Debt A 


34 10,013710,0148|0,0173]0,019010,021710,0319 
39 |0,013310,014410,0168|0,0185|0,021110,0309|0 


90,0507 


.061 110, 0660 
4۱0 ,0488} ) 


folosim notatia F(a) ~ G(z). 


Pentru a verifica ipoteza H,: F(x) ~ F(x), unde Fo.) este 36 /0,0129/0,0141/0,0164,0,01809,0205/0,0300/0,0429 0,0470 
o functie de repartitie pentru care primele 2 ie a sînt zero şi 37 |0,0125/0,0138/0,0160/0,0176/0,0200/0 ,0291]0 ,0414]0 ,0454|0 , 0: 
۳ 11 : IN : / Pee ur 38  |0,0122/0,0135/0,0156/0,017210,0195/0,0283/0,040010.,0440/0.,0 

'espeetiv unu, Saapiro-Francia (1972) propu Statistica : H 다이 ار‎ A abt d یر‎ | 
respectiv unu, Shapiro-Francia (1972) propun statistica 39 [0,0120/0,0133/0,0152/0,0168|0,0190|0,0275/0,0386/0,0426/0,0465/0,0512/0,053 
n 2 40 10 , 01180 , 01310 , 0148/0 , 0164۱0 , 0180610 ,7 0; 0375/0 „041410 ,0447/0 „0499100510 
Vo buy 41 ¡0,0116 ut Dr nea edid 0,0260/0 ,0: 364/0,0402 0,0430/0,0476/0,0493 
۷ 베스 42. 10.011410 , 012710 , 0140/0 ,0158|0 ,0178|10 "0253/0; 0355/0,0389/0,0417]0,0464|0,0482 
1 W; 5 و‎ Va Yin 43 ]|0,0112/0,0125/0 ,013710 ,01: 550; 01740,0248 (0,0405]0 , 045210 ,0471 
(5.1) Y, Wo — 3» 44 |0,0110/0,0123/0,0134/0,0152/0,0170/0 ,0243| 69/0,0394|0 ,0440/0 ,0460 
: Yo 4 45 0,0108/0,0121/0,0131/0,0149/0,0166/0,0238| 59/0 ,0385/0,0423/0,0449 
: 46 0,0106/0,0119/0,0129/0,0146/0,0162]0,0233 ) 9/0,0376/0,0416]0,0438 
0 y tuom don i "e: 내 
Ya J (m) 7 |0,0104/0,0117/0,0127]0,0143/0,0158/0,0228/0,0311]0,0340/p ,0367]0,0394]0 ,0427 

unde , > 1 
y ۳ 48 10,0103/0,0115 0,0125/0,0141/0,0155/0,0223/0 0303/0 „0332 0,0358/0,0382/0,0416 

| 
(5.2 Di 4 VN MULT M (9| Ho) 49 |0,0102/0,0113/0,0123|0,0139/0 ,0152/0,0218/0,0295,0,0324/0 ,0349]0 ,0371]0 ,0405 
F n 2 Jt 1 | 
(> mi) ^ 50 [0,0101/0,0111]0 ,0122]0,01370,0149|0,0213/0 02880 ,0317|0 ,0340/0 03600, 0394 
기 T ۱ 
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Tabelul 4.1. (continuare) 


ا لا بے 


n | 7 T 
n 0,005| 0,01 | 6,025} 0,05 | 0,10 | 0,50 | 0,90 | 0,95 |0,975| 0,99 0,995 


| | 
1 TAI e 1 

| | | 
0,0100/0,0109/0,0120 0,0135/0,0147/0 ,0209 0,028210,0310/0,0331 0,0349/0,0383 


51 

52 0,0099/0,0107/0,0119/0,0133/0,0145/0,0205/0 ,0276/0,0303/0 „032310 „0341 0,0373 
53 |0,0097/0,0106/0,0118/0,0131/0,0143/0,0201|0,0270|0,0296/0,0315|0,0332/0,0363 
54 10,0095/0,0104/0,0116/0,0129]0,0141]0,0197/0,0264]0,0289|0 ,0307/0 ,0329]0 ,0353 
Y 0,0094/0 , 0100 ,01150,0 „013910 „,019310,0258|0 ,0282/0,0299 0,0321/0,0343 
56 0,0093|0,0102/0,0113/0,0125/0,0137/0,0189/0 „025210 ,0275|0,029210 „0313 0,0333 
57 10,0092/0,0101/0,0112/0,0123/0,0135|0,0185/0,0247/0,0268|0 ,0285/0 ,0306/0 ,0324 
58 0,0091/0,01000,0110/0,0121/0,0133/0,0182¡0 ,024210,0262j0 „027910 „0301 10 „0318 
59 |0,0090/0,0098|0,0109/0,0119]0,0131/0 ,0179/0,0238/0 ,0257/0 ,0274|0 ,0296/0 ,0312 


60  |0,0089]0,0095/0,0108]0,0117]0,0129/0,0176 0,0234|0,0252]0,0270/0 0291 0,0306 
61  |0,0088/0,0093|0 ,0107/0 ,0115/0 : 01270017310 0230/0 , 0247/0 ,0266/0,0286/0 ,0301 
62  |0.008710,009210,0105/0,0113/0,0125|0,0170/0,0226/0,0242/0,0262]0 ,0281/0,0296 
63 lo 0086/0,0091l0,0104/0,0112|0,0123/0,0167/0,0222/0,0238/0,0257/0,0276/0,0291 
64 |0,0085/0,0090]0,0102/0,0111/0,0121/|0,0164/0,0218/0,0234/0,0252/0,0271]0,0286 
65  lo.0084/0,00890,0101l0,0109/0,0119/0,0161|0,0215|0,0230/0,0247/0,0266/0,0281 
66  |0,0082/0,0088|0,0099/0,0108|0,0117/0,0159/0,0211/0,0225/0,0242 0,026110 ,0276 
67  |0,0081|0,0087/0,0098/0,0107/0,0115/0,0157/0,0207|0,0221/0,0237/0,0256/0,0271 
68  |0.008010,0086/0,0096/0 ,0105/0,0114]0,0155/0,0204/0,0217|0,0232/0,0251/2,0266 
69  10,0079]0,0085|0,0095|0 ,0104|0,0113/0,0152/0,0198/0,0213 0,0227/0,0246/0,0261 
70 . |0,0078/0,0084/0,0094/0 ,0103/0,0111]0,0150]0,0194]0,0209/0,02220 ,0241/0,0256 
71 0,0077/0,0083|0,0093/0,0102/0,0109/0,0147/0,0191|0,0205/0,0218|0,0237/0,0251 
72 . |0,0076/0,0082/0 ,0092/0 ,0101/0,0108/|0,0145|0 ,0188 0,0201/0,0214/0,0232|0,0246 
"73 0,0075/0,0081/0,0091/0,0100/0,0107/0,0143/0,0185 0,0198;0,0211/0,022€ 9,0241 
74 0007410008010 0090107 0098/0 ,0106/0 ,0141,0,0182/0,0195 0,0208[0,022412,0236 
75 0007310 007910 : 0۲089۱0 ۰0۱097۱0 ,0105/0,01 39/0,0179 0,01920,0205] ),0220/0,023 

76  10.:0073|0,0078l0,0088|0,0096/0,0104/0,0137/0,0176/0,0189/0,0202/3,0217/),0227 
77 10,007210,0077/0,0087/0,0095/0,0103|0,0135/0,0173/0,0186/),019£|>,0214]),0223 
78  |0,0071/0,0077/0,0086/0,0093/0,0101 0,0134/0,0170/0,0183/0,0196/),0211/),0219 
79 0,0070/0,0076/0,0085 0,0092/0,0100/0,013210,0168|0,0180/0,0193|),0208 9,0215 
80  |0,0070/0,0075|0,0084/0 ,0091]0 ,0099|0 ,0131/0,0166/0 ,0177/0,0190/0,0205|9,0211 
81  |0,0069/0,0074/0 ,0083|0 ,0090/0 ,0098/0 ,0129/0 ,0164/0,0175/0,0187|0 ,0202|0 ,0207 
82 0006810 ,0074/0 008210 , 0088/0 ,0097/|0 ,0128/0 ,0162/0 ,0173,0,0184 0,0199/9 ,0203 
83 01006710007310 008110 008710 ۰009610 , 0126/0 , 0160/0 , 01700, ۵ 0,0199 
84  |0,0067|0,0073/0 ,0080|0 ,0086/0,0095/|0 ,0125/0 ,0158|0,0168/0,0178/0,0193/0,0196 
85  10.0068/0,0072]0,0079|00 ,085|0 ,0094|0 , 012310 , 015610 , 016610 ,0174/0,0190/0,0193 
86 0 00006610: 007110 ,0078)0 0085۱0 ,0093)0 ,0122 0,0154/0,0164/0,017210,0187/0,0196 
87 0,0065|0,0071]0,0077|0,0084|0,,0092]0,0120|0,0152 0,0162/0,0170 0,0184/0,0187 
88  |0,0065/0,0070 0.0077/0,0084|0,0091/0,0119/0,0150/0,0160/0,0168/0,018110,0185 
89 0,0064/0,0070/0,0076|0,0083/0,0090/0,01 17/0,0148/0,0158/0,0166 0,0179/0,0183 
90 0,00640 ,0069|0 ,0075|0 ,0082/0 ,0089|0 ,0116|0 ,0147|0 ,0156/0,0164/0,0176/0,0181 
91 —10,.00623/0,0068/0,0075/0,0082]0 , 0088/0 ,0114/0,0145/0,0154/0,0162/0,0173/0,0179 
92  |0,0063/0,0068|0,0074]0 ,0081 0,0087/0,0113/0,0143/0,0153 0,0160/0,0171/0,0177 
93 |0,0062/0,0067/0 ,0073/0,0081/0,0086/0 , 011210 ,0141/0 ,0151]0,0158/0,0168/0,0175 
94 0,0062/0,0067/0 ,0073]|0 , 0080 |0 , 0085 0,0110/0,0139/0 ,0149]0,0156/0,0165/0,0173 
95  |0,0061/0,006610,0072]0,0079/0,0084|0 ۱0۵109۱0 ,0138/0 01470 ,0154/0,0163/0,0171 
96  |0,0061/0,0065|0 ,0072]0,0078]0,0083J0 0108/0 ,01360,0145/0,0153/0,0161,0,0169 
97  10.0060/0,0065|0,0071]0,0077|0,0082/0 0107/0 ,0134/0,0143/0,0152]0,0159/0,0167 
98  10,0060/0,0064/0 ,0070/0 ,0076/0 ,0081]0 ,0105)0 , 013310 ,0142]0,0151]0,0157]0,0165 
99  |0,005910,0064/0 ۱007010 ,0075/0 , 0080/0 ,0104/0 ,0132/0 ,0140/|0,0150/0,0155/0,0163 


100  |0,0059]0,0063]0,0069|0 , 00740 ,0079/0 , 0103/0 , 0131/0 و‎ 0139/0 ,0149/0 ,0153 0,0161 


n 
Propoziția 5.1. Avem y, bà > 0 
1 
"iiia KO QULA. y ; . $ y y d V S3 
Propoziția 9.2. Statistica W; este invariantá la factorii de poziţie 
$i scară. | 
E ED AA a 4 ; 
Festul Shapiro-Francia respinge ipoteza H, dacă 


m 1 
(5.3) We Bs 
unde W, este determinat din ecuatia 
(5.4) FW st Aaa | Ela) ze a. 


Propoziția 5.3. Testul bazat pe statistica W; este echivalent cu 
testul bazat pe 


RE ㅣ en Ju — y 2 
(5.5) U, = ¥ وا‎ TS — b], unde Si = (n — 1)s? 


k Y n 
۳ 1 ۵ n 


1 I 1 Of f yr H p. 더 
Cum U, = 2(1 — /W;) este o funcţie monoton descrescătoare de 
WA testul bazat pe U, respinge ipoteza Ho dacă 


na 9 9 desea 
(5.6) U, — Ung = 2(1 E Wap) 
Propoziția 5.4. Testul bazat pe statistica U, (si deci pe W;) este 
consistent. 
y sistent: q 1 a pe X 7 arată x : J .. 
b. iunio testului bazat pe W; arată că pentru funetii de 
repartiție F,(+) care nu sint echivalente cu F(x) prin seară si trans- 
latie de poziţie, avem i 
1 p] TE s 4 ۳ dia VA 
lim P(W, > wrol F(a) = F,(a))\= 1. 
Observatie. Pentru verificarea normalititii 


3 i 
(1/n) Y | ی‎ |; 
n +1 
este asimptotic cel mai bun estimator al abaterii medii pátratice, 
adicá are aceleagi proprietáti ca si 
m'V-!y/m'V -*m 
Prin urmare are loc teorema 
Teorema 5.1 Cu excepti y i istici j 
. L 6 a unui factor de scară, statisticile S 
PT زاوج‎ Onea 2710 uni fac „scară, statisticile Shapiro- 
t și apiro-Francia au în ipoteza nulă aceeași repartitie asimp- 
loticd. 
_ Statistica Shapiro —Francia pentru verificarea exponentiali- 
tatilor este 


$ x aol (n —j +1) — y zo} 


(5.7.) ML PEN) icd 


n , 


pa (za — x) 


t=1 


297 


Pearson, Hartley (1972) în tabela 19 dă pentru selecții de volum 
< 60 coeficientii necesari pentru calculul numaratorului. Pentru 
testul bazat pe W” se folosesc valorile critice inferioare. 


6. Program şi subprogram FORTRAN privind testul Shapiro-Wilk 


1. Statistica W se poate calcula după procedeul expus in para- 
graful 2. Subprogramul funcție ce calculează valoarea acestei sta- 
tistici l-am numit SW, iar schema lui logică este dată în fig. 14.1. 


FUNCTION SW(X,N,A) 


23. DIMENSION X(N), A(N) 
ex | XM — 0. 
HL | r 7 
ri: TEN) | DO 1I =1,N 
| تست‎ l| | xm XM + X) 
E MT | | XM = XM/FLOAT(N) 
XM=XM/N | | 
L_S=0 | S=@. 


DO 2 Jes Ban 
۲1 = XAU) — AM 


2T 18 aS 44420 
| K = 9 
BEA 


POZE = GE 


이 —X(1) + B 
SW Be B/S 


unde : 


X — vectorul statisticilor de ordine (real) 

N — dimensiunea vectorului X (întreg) 

A — coeficienţi tabelati ai statisticii W (real) 

in subprogram este esenţial ca valorile lui X să fie în ordine 
crescătoare. 


v4 O0‏ و بو 


2. Un program principal de obţinere a statisticii W este : 
DIMENSION X(500), A(500) 
READ(105,1)N 


1| |FORMAT(I4) 
|READ(105,2) (A(I), I — 1,N) 
2 | |FORMA T(20FS.4) 


CALL SORT(X,N) 

| W =.SW(X,N,A) 

WARITE(108,3)W 

FORMA 1 STATISTICA SHAPIRO-WILK ESTE’, F15.6) 
ls TOP 

[END 


1 
| 
| 
| READ (105,2) (X(1), 1 = 1,N) 
| 
| 
| 
| 
| 
| 


Datele se dau în telul următor : pe prima cartelá se dă numărul Y 
(coloanele 1—4) pe următoarele cartele se dau cele N valori ale coe- 
ficientilor A cite 10 pe o cartelă (ultima poate fi incompletă), fiecare 
coeficient ocupind cite 8 coloane (ultimele 4 cifre sînt partea zeci- 
mala); în continuare sint cartelele cu statisticile de ordine X pre- 
zentate la fel ca elementele Ini A. La imprimantă apare valoarea 
statisticii Shapiro-Wilk. In program se folosese subprogramele 
SORT sg SW. 
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GAPITOLUL 5 


TESTUL D'AGOSTINO (D) 


1. Introducere 


Estimarea abaterii standard a populaţiei normale a suscitat 
de-a lungul timpului un interes viu. În mod natural, unii estimatori 
ai lui o pot fi obţinuţi direct prin extragerea rădăcinii pătrate din 
رقم‎ însă proprietăţile noilor estimatori vor fi diferite de ale celor din 
care au fost obţinuţi. 

Astfel, eonsiderind statistica 


] AST LH 1 n 개 i 1/2 
(1.1) Be = gis (2) 
^ 4 n 4 


avem 
di r( n ۳ 1 ۱ 
(1.2) M(S) = ps 시 Eat AT 


ceea ce arată că S este un estimator deplasat pentru ۰ 
Dintre estimatorii abaterii standard de un interes deosebit 
se bucurá estimatorii lineari, acest fapt explicindu-se prin utilizarea 
lor in verificarea ipotezelor statistice. 
Gini (1912) introduce statistica 
9 n—1 n 


13 == Ai |X, — Xy! 
( ) 9 n(n — 1) 2 j A 


care ulterior a fost numită diferența medie a lui ۰ 
Deoarece 


(1.4) M(g) 


n—1 n 
(1.5) € ES ec HN A 
00 n(n SR e! ae Vi و2‎ | 
este un estimator nedeplasat pentru c. 
Avem 
y 1 n E ap 
(1.6) D*(cf) = ————| — (n + 1) + 2 (n — 2) /3—2(2n —3) | c? 
n (n —1)L 3 
Observație i) David (1968) arată cá g apare in forma 
^ 1 n ^ p 
(1.7) Y IX — Xil 


n(n — Dif 


intr-o lucrare a lui Helmert (1876). Acesta o reia, de fapt, dintr-un 
articol a lui Von Andrae (1872) care a utilizat-o ca estimator nede- 
plasat al erorii probabile (0,6745 c) sub forma 


(1.8) a ۱ ۳) SPE DW 

/ P Ee en ua ada n — 21 + Ya 
e sn DY, T i 

unde Wo = Xa-iep — Aq. LUAM 

ii) Dacă 2, > 4, . > 2, (ordonám variabilele), 


atunci 
/- Te 
T 
ot = Papu (n. — 2k + 1) Ry 
(1.55) n(n — 1) =1 
diy m3 QE S a pai Moe My o aras II DI] 


Dawnton (1966) propune statistica : 


27 T 
(1.9 ای‎ ve OR 1^ 
(1.9) 자 nin — 1) 
M TS 1 3 
unde T = Y f; mic dar 1) | Xin 
fal A 


ca estimator nedeplasat pentru abaterea medie pátraticá a repartitiei 
normale. 

Observație. David (1968) a observat că estimatorul lui Dawnton 
reprezintă, de fapt, o variantă a diferenței medii a lui Gini. Într-ade- 
var, tinind seama că 


ns 
(1.9") y d bey idee 3 Oe 
n(n — 1) 


301 


(1.10) Şi roata omes 
n(n — 1) 5523 

Şi cum 

1 x » n 

= UNE en cms “e ANU a H NL (e DX 

] Uê 1 X cat E P = de (2 Me 1) Xie 

4 3,51 t>j=1 1=1 j 

rezultă : of — = yx g. 
d 


"oF "3 11 Ty M J Fc P 1 

Estimatorul lui Downton a fost folosit pentru construirea 
unui test analog cu testul f pentru verificarea ipotezei u = Bo, fata 
de alternativa y # u. (Barnett, Mullen, Saw. (1967)) si penti u con- 
struirea unui test pentru verificarea normalitatii pentru selecţii de 
volum > 50 (D'Agostino (1971)) 

Q Sa 4 NP 23 ۸ 

Statistica folosită de Barnett, Mullen, Saw (1967) este 


(1.11) Y 


» 
oin 3 aan ul Downton şi X sînt necorelate. 
: ropozitia 1.2. T | n? si S sînt asimptotic repartizate normal cu 
dispersia de ordinul 1/n 


2. Statistica D. 


y D'Agostino (1971) consideră statistica 
(2.1) D = Ti(n 82). 


Propoziția 2.1. Statisisticile D si B sint independente, 
Corolar. Pentru k > 0, avem 


و 


1 MT) 
208/2 M(n?sy 


)2.2( M(D*) 


$$ tn. particular 


"( ti A) 
a MD) Bo ES - 1/ (2V7) 8209479 
2) 2n 7 r ( ij = 1/ (2y x) = 0,282 1 


(84) morati (3 n 2) (n — 2) 4 0 — 3) (n — 9) 
47 
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Urmează că 

123 —8T-9e «eee [- 

(2.5 BD) = | sai : VDD) = 0,02998598/ ln 
j 24n T 


Propoziția 2.2. Asimptotic 
D — (2/7)? 
V D*(D) 
Observatii i) Dacă repartiția alternativă ipotezei normale are 
excesul mai mare (mic) decît al celei normale, atunci M(Y) tinde 
către un număr negativ (pozitiv). Abaterile de la normalitate sint 
reflectate în valorile variabilei Y mai mari sau mai mici decît media 
repartitiei normale. 
ii) Convergenta repartitiei statisticii Y către repartiţia (0,1) 
este lenta. 


(2.6) by 


N (0,1) 


3. Testul D'Agostino 


Testul constă în următoarele 
1. Se calculează valoarea statisticii D după formula (2.1) şi a 
atisticii Y, dupa formula (2.6). 
2. Se acceptă ipoteza de normalitate la pragul de semnificaţie 
x daca 
Yesin E CY & او‎ , x) 


s. n, l- rz 


cuantilele statisticii Y pentru selecții de volum n = 5(10) 100(50)1000 


fiind date în tabelul 3.1. 

Exemplul 3.1. (Tövissi, Vodă (1982)). S-au supus încercărilor 
de laborator 70 pompe cu pistonase axiale, înregistrindu-se 
mentul defectării fiecăruia. Datele experimentale (în ore) au 
următoarele 


62, 64, 66, 67, 97, 11 149, 
200, 200, 200, 200, 214, „217, 222 
248, 252,255, 255, 282, 300, 300, 308, 


of 
347, 347, 350, 350, 352, 356, 373, 380, 
400, 401, 402, 408, 410, 410, 412, 428, 431, 
Se obtine 


te ۲ : Er E : E | oeeen 
© c 299, S — 117, 31; n? 1900, yn 8,36660 


T = 164368, D = 0,28580 


y ...0,28580—0,282098 — 555 
0,00358 


Yo; 0,025 = .— 2,002, Yo, 0,975 = 1,176 
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Tabelul 3.1 


Cuantilele statistieii Y 


prag de semnificație 


| 
| 


i | | 
5 | 1 2,5 | s 10 90 | 95 m 5 | 99 | 99,5 
| | | | | 
50 | —3,949 | — 3,442 |—2,7571|—2,220|—1,661| 0,759] 0, vla ,038 m 1,192 
0,807| 0,986| 1,115| 1,236| 1,301 
70|—3,762|— 3,293 —2.652 —2,146|—1,612| 0,844 1,036 1,176| 1,312| 1,388 
80|—3,693|—3,237|—2,0613 — 27118 —1,594| 0,874} 1,076| 1,226| 1,374] 1,459 
90|—3,635|—3,100|—2,580|—2,095|—1,579]| 0,899 | 1,1091 1,268| 1,426] 1,518 
100 |— 3,584 |—3,150]—2,552|—2,075|—1,566| 0,920 | 1,137] 1,303] 4,470} 1,569 
150 | —3,409 | —3,009|--2,452|—2,004|—1,520| 0,990! 1,233] 1,423] 1,623] 1,746 


200|—3,302|—2,922| — 2,391 | — 1,960 
250 | 3,227 |—2,861 |— 2,318 |— 1,926 
300 | —3,172 | — 
350 | — 3,129 
400 | —3,094 
450 | —3,064 
500|—3, "040 
550 |— 3,019 
600 3 000 


1,299] 1,496] 1,715] 1,853 
,328 1,545] 1,779] 1,927 
1,528] 1,826] 1,983 
1,610} 1,863] 2,026 
1,633] 1,893] 2,061 
1,652] 1,918] 2,090 
1,668 1,938} 2,114 
1,682! 1,957] 2,136 
1,694 1,972] 2,154 


2,816 | —2,316 |- 
BL | 2 204 
9753] 2 070 
Db eae 059 

2,709 | 2,239 
42,691 |—2.226 
-2,676 | —2,215 


650 |—2,984 | —2,663|—2,206 1,704| 1,986| 2,171 
700 | —2,969 | —2,651|— 2,197 1,714| 1,999| 2,185 


750 | —2,956 | —2, 640 | —2,189 1,722 


2,010] 2,199 


| 
| | zi 
60 | -3, 846 | —3,380 | —2,699 | 2,179] —1, 634 


800 | —2,944 TE) at, 182 |— 1,730| 2,020) 2,211 
850 —2,933 —2,021 2,176 nous 2,029) 2,221 
900 |—2, 923 | —2,613 | — 2,170 —1,800|— 1,386 ,168| 1,481| 1,743| 2,037| 2,231 
950 | —2,914 | —2,605 —2,164 —1,796|—1,383 ,171 1,485| Y 749| 2,045| 2,241 
1000 | — 2,906 —2.599 —2,159 | —1,792 | - 1,1 ,174| 1,489| 1,754| 2,052] 2,249 


Cum Y, e (—2,652, 1,176) se acceptă ipoteza de normalitate. 

Observaţii i) Statistica D este folositoare atunei cînd tipul aba- 
terii de la normalitate nu este cunoscut. 

ii) Statistica D se folosește pentru n > 100 în care caz W nu mai 
dă rezultate bune. Chiar pentru » — 50, D este la fel de puternic sau 
chiar mai puternic decit W 1 unele alternative (de exemplu 
X2(2), dublu exponențială, lognormal’ (u = 0, o? = 1)) 

iii) Datorită lipsei tabelelor pentru valorile critice ale unor teste, 
se foloseşte statistica D și în cazul în care tipul abaterii de la nor- 
malitate este cunoscut. 

iv) Pentru selecţii de volum < 50, simulările au arătat că curbele 
lui Pearson furnizează concordante bune pentra cozile inferioare 
pentru toate selectiile de volume > 10 (D'Agostino (1972)). 
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20 — e. 271 


4. Subprogram FORTRAN pentru statistica D'Agostino 


1. Statistica folosită în testul D'Agostino se află aplicînd for- 


mula (2.1). Rezultă subprogramul funcţie pentru aflarea statisticii 
D pe care l-am numit SDA. 


FUNOTION SDA(X,N) 
DIMENSION X(N) 
XM — 9. 
DO1lIc-1,N 

1| [XU = XM 4X() 

XM = XM/FLOAT(N) 


DO 27 =1,N 
T = T+(I~O.5*(N +-1))*X(Z) 
내 pL hos — XM 


bo 


SOR leal T(N) )‏ و 
SDA = T/(S*N*N)‏ 
RETURN‏ 

END 


unde : 
X — vectorul statisticilor de ordine (real) 
N — dimensiunea vectorului X (întreg). 
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GAPITOLUL 16 


TESTE DE INDEPENDENȚĂ ȘI VERIFICAREA NORMALITATH 


1. Introducere 


Fie X; ...,X,, 0 selecţie de volum 2n. Fie Y, E Y, +X پو‎ 
ŞI Z; = | Xu-3 —Ay|, 1=1, 2, ...,n. Statistica Y, este indepen- 
dentá de Z,, i # j, pentru orice repartiție. Totuşi Y, este indepen- 
dentá de Z; numai pentru repartiţia normală. Deci un mod de a 
verifica normalitatea, nu necesar cel mai bun, este de a verifica inde- 
pendenta statisticilor Y; si Z;. 

Nici unul din testele de independenţă cunoscute nu are putere 
mare pentru alternativele Cauchy şi x Deci apare necesitate 
introducerii unui nou test care să înlăture neajunsul semnalat. 
Pentru a ne da seama de natura formulei, considerăm diagramele 
de puncte ( Y;, Z;) pentru variabila X repartizată N (0,1) si pentru 
cele două variabile pentru care testele de independenţă, au putere 
mică. De obicei media si dispersia variabilei normale sint nec unoscute 
ceea ce face necesar ca testul dat să 116 invariant fata de poziţie si 
scará. Pentru o mai usoará interpretare a diagramei de puncte unim 
punctele prin linii. Apoi ducem o dreaptă paralelă cu axa i . Gásim 
că graficul pentru repartiţia normală este tăiat in mai multe puncte 
decît celelalte grafice. Prin urmare, un procedeu pentru verificarea 
normalitátii constă în următoarele : se acceptă (respinge) ipoteza 
de normalitate dacă numărul de intersecţii este mare (mic). 

Un alt procedeu constă în a trasa o dreaptă ca în procedeul 
anterior şi de a considera cea mai lungă iteratie dintre iteratiile SUS-JOS 
fata de dreapta considerată. Pentru repartiţia, normală cea mai lungă 
iteratie este mică in timp ce pentru celelalte repartitii este mare. 

Numărul mediu "de intersecţii este maximizat |dacă dreapta 
P(Z <2*) = 0,5. Repartiția numărului 


este trasată astfel incit 
de intersecţii 7, are funcția de frecvențe 


v 
Fir, 2n) ip y 0141/2372 
j=l 


one 


2. Testul celei mai lungi iterații (testul L) 


Pentru a verifica ipoteza H, conform căreia, A PPL VUA ce 
este o selecţie asupra unei variabile normale cu media şi dispersia, 
necunoscută, parcurgem următoarele etape : 

1, Găsim toate cele C? perechi de observaţii {X,, X,) ; 

2. Pentru fiecare pereche (X,, A) introducem notatiile 
(2.1) Vi = Xi + X; si Zu = |X, — Pee Ar cdi Ta 

3. Reprezentüm grafic cele 02 puncte în planul Y, Z; 

4. Trasám dreapta 


AE S 1/2 
(2.2) 2 ۳ رز‎ OG — X)?/(n — 24 o 
$1 

unde C este mediana repartitiei F(1,(n —2); 

5. Luám iteratia cu cea mai mare lungime (considerăm iteratiile 
fata de dreapta de la etapa 4); 

6. Respingem ipoteza H, la pragul de semnificatie « dacă 
L >l, unde L este iteratia cu lungime maximă si P(L <1) = a. 

Observatie. c? fiind estimat, alegem 2* astfel încât Rflg > 
<2" | Hg), =. 1/2. Această alegere nu va maximiza valoare medie a 
numărului de iterații, însă neavînd o alegere mai bună pentru 2*, 
vom lucra cu ea ca în 4. 

Exemplul 2.1. Ne propunem să verificám i poteza conform căreia, 
0,493; 2,390; 0,495; 0,080; 0,608; 0,497; 6,478; 3,064; 0,116; 
0,664 provin dintr-o populaţie normală. 

Pentru a calcula statisticile y si 2, ordonám observaţiile în ordine 
crescătoare și întoemim un tabel în care cifrele de deasu pra (jos) sint (2). 


| 0,080 | 0,416 | 0,493 | 0,495 | 0,497 | 0,608 0,664 | 2,390 | 3,064 

B. 23/050 NIMM TAN a magie 벌로 a a | 
0,116 | 0,196 | | 

0,036 | 
0,493 | 0,573 | 0,609 | 

0,413 | 0.377 | 
0,495 | 0,575 | 0,611 | 0,988 

0,415 | 0,379 | 0,002 
0,497 | 0,577 | 0,613 | 0,990 | 6,992 

0,417 | 0,381 | 0,004 | 02 | 
0,608 | 0,688 | 0,724 | 1,101 | 1,103 | 1,105 
0,664 | 0,744 | 0,780 | 1,157 


0,584 | 0,548 | 0,171 

2,890 | 2,470 | 2,506 | 2,883 
2,310 | 2,274 | 1,897 
3,064 | 3,114 | 3,180 | 3,557 
2,984 | 2,948 | 2,571 

6,478 | 6,558 | 6,594 | 6,971 
6,398 | 6,362 | 5,985 


1 E 5,454 
2,456 | 2,400] 0,674 
7,086 | 7,142| 8,868 | 9,542 
5,870 | 5,814] 4,088 | 3,414 


0,528 | 0,492 HE- 9,111 
| 
| 
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Cum mediana repartitiei (1,8) este 0,499 si Y (zr, — x)? = 
— 36,474 urmeazá cá (2.2) are expresia 


z = [2(0,499) (36,474) / (8--0,499) ]V? = 2,07. 


Deci vom număra iteratiile faţă de dreapta 2 = 2,07. În acest 
scop vom ordona perechile (y, 2) in ordine crescătoare după y si 
pentru fiecare 2 > 2,07 (> 2,07) punem un 0(1). Astfel se obţin 
succesiuni de 0 si 1, deci iterații. Găsim 


000000000000000000000 1100000 11111110 111111111 
eam" TS ETS 
2] ) 7 9 


şi din tabelul 2.1 respingem ipoteza de normalitate la pragul de 
semnificaţie « = 0,052. 


3. Testul numărului de iterații (F) 


O altă statistică test bazată pe acelaşi grafic este numărul de 
iteratii. Puterea acestui test este asemănătoare cu a testului L. 

Pentru aplicarea testului parcurgem următoarele etape 

Ri — R.4. Aceleaşi ca L.1—L.4. 

R.5. — Socotim numărul de iterații E faţă de linia (L.4) 

R.6 — În tabelul 3.1. este dat P[R <r] = «. Respingem ipo- 
teza H, la pragul de semnificaţie « daca E > ۰ 

Exemplul 3.1. Pentru datele din exemplul 2.1 . găsim r = 6. 
Respingem ipoteza H, la pragul 0,64. 
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Tabelul 2.1 


Probabilitatile cozii superioare ale statisticii L. Prima intrare dă valoarea lui L si a doua 
P(L<1) obţinută prin simulare. 


1 | 0,75 0,80 0,90 | 0,95 

| | 

7 | 8(0,71) 9(0,78) 9(0,78) | 11(0,93) 

9(0,78) 10(0,93) 10(0,93) 12(0,98) 

8 9(0,65) 10(0,77) 14(0,89) | 14(0,89) 

10(0,77) 11(0,81) 15(0,98) | 15(0,98) 

9 |! 7430,72) 12(0,79) | | 14(0,88) | 17(0,94) 

| 12(0,79) 13(0,83) | 15(0,92) | 18(0,96) 

10 | 15(0,73) | 140,79 16(0,89) 20(0,95) 

| 14(0,79) | 15(0,86) 17(0,91) 21(0,97) 

11 | 14(0,73) 15(0,79) 190,90) | 22(0,95) 

| 15(0,79) 16(0,83) | 20(0,91) | 23(0,95) 

12 | 15(0,74) 160,78) |  20(0,90) | 24(0,95) 

16(0,78) 170,81) | 21(0,92) | 25(0,96) 

13 16(0,73) 18(0,79) | 22(0,90) | | 27(0,95) 

17(0,76) 19(0,83) 23(0,91) | 28(0,96) 

14 17(0,73) 19(0,80) 23(0,89) 28(0,95) 

18(0,76) 20(0,83) | 240,90) | 29(0,96) 

15 | 18(0,74) 19(0,77) | 24(0,90) 29(0,94) 

19(0,77) 20(0,81) | 25(0,91) | 30(0,95) 

16 | 19(0,74) 20(0,77) 25(0,89) | 31(0,95) 

20(0,77) 21(0,80) 25(0,90) | 32(0,95) 

17 19(0,73) 2100,79) |  26(0,89 | 32(0,95) 

20(0,76) 22(0,82) | 27(0,91) | 33(0,95) 

18 20(0,73) 22(0,79) | 27(0,90) 32(0,94) 

21(0,76) 23(0,81) |  28(0,91) 33(0,95) 

19 21(0,74) 23(0,79) | 29(0,90) 34(0,94) 

22(0,77) | 24(0,81) ۰ |. 30(0,91) | 35(0,95) 

20 21(0,72) |  23(0,78) 29(0, 89) 36(0, 95) 

22(0,75) 24(0, 81) 30(0, 90) 37(0,95) 

25 23(0,73) 25(0,78) | 33(0, 90) 41(0,95 

; 33(0, (0,95) 

24(0,76) 26(0,80) 34(0,91) | 42(0,95) 

30 26(0,73) 29(0, 80) 360,89) | 46(0,95) 

27(0,75) 30(0,82) 37(0,90) | 47(0,95) 

40 29(0,73) 32(0,79) | 42(0,90) 50(0,95) 

30(0,76) 33(0, 81) 43(0,90) 51(0,95) 


Mc Donald, Katti (1975) 
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- 


13 


14 


18 


19 


30 


40 


valoarea lui r (P(Rxr)). 


Tabelul 3.1 
Probabilitatile cozii inferioare pentru repartiţia lui R. Prima (a deua) intrare dà 


0,05 0,10 0,20 
2(0,02) 2(0,02) 3(0,11) 
3(0,11) 3(0,11) 4(0,21) 
2(0,01) 4(0,10) 5(0,20) 25) 
3(0,06) 5(0,20) 6(0,25) 33 
4(0,04) 4(0,04) 7(0,19) 23) 
5(0,01) 5(0,01) 8(0,23) 31) 
4(0,02) 6(0,06) 9(0,19) 22) 
5(0,06) 7(0,01) 10(0,22) 29) 
6(0,04) 9(0,10) 12(0,19) 23) 
7(0,06) 10(0,11) 13(0,23) 26) 
8(0,03) 12(0,10) 15(0,19) 21) 
9(0,05) 13(0,13) 16(0,21) 26) 
11(0,05) 14(0,08) 18(0,17) 
12(0,05) 15(0,10) 19(0,21) 
14(0,04) 18(0,08) 23(0,20) 
15(0,05) 19(0,11) 24(0,22) 
19(0,05) 23(0,09) 28(0,19) 
20(0,05) 24(0,11) 29(0,23) 
22(0,04) 27(0,10) 32(0,18) 
23(0,05) 28(0,10) 33(0,21) 
28(0,05) 32(0,09) 38(0,17) 
29(0,06) 33(0,10) 39(0,20) 
32(0,05) 38(0,10) 44(0,18) 
33(0,06) 39(0,12) 45(0,21) 
36(0,04) 44(0,10) 50(0,18) 
37(0,05) 45(0,12) 51(0,20) 
44(0,05) 51(0,10) 58(0,18) 
45(0,05) 52(0,10) 59(0,20) 
81(0,05) 90(0,10) 100(0,18) 
82(0,65) 91(0,11) 101(0,20) 
130(0,95) 141(0,10) 155(0,20) 
131(0,06) 142(0,10) 156(0,20) 
265(0,05) 284(0,10) 302(0,20) 
266(0,05) 285(0,10) 303(0,21) 


Mc Donald, Katti (1975) 


1 CAPITOLUL. 17 


COEFICIENȚII PEARSONIENI SI VERIFICAREA NORMALITATII 


1. Introducere 


Momentul centrat de ordinul trei caracterizează asimetria re- 
partiției. Dacă repartiţia este simetrică în raport cu valoarea medie, 
toate momentele impare (dacă există) sint nule. Într-adevăr, dacă, 
variabila este continuă şi s este impar s 


oo 


Us = ۱ (aj— y) f(x) da 


este nulă deoarece avem o integrală dintr-o funcţie impară luată 
între limite simetrice. În cazul în care X este discretă 
n 


(a u) pil‏ = ون 


i=l 


La fiecare termen pozitiv corespunde un termen negativ egal în 
valoare absolută, astfel încît suma este nulă. 

Deci pentru a caracteriza asimetria unei repartitii luăm unul 
dintre momentele impare, dintre care cel mai simplu este momentul 
de ordinul trei. El are dimensiunea cubului variabilei aleatoare ; 
pentru a obține o caracteristică fără dimensiune considerăm raportul 


2 

(1. 1) Q Bs ولا‎ 1 i "v5 A. isa. 

pi 가 ۳1 ار‎ xe Sau vi ¿TU P1,— 
Us i 


Definitia 1.1. (1.1) poartă numele de coeficient de asimetrie. 
Hepartitille pentru care f, — O0 sint repartitii cu asimetrie 
pozitivă, iar cele cu B, < 0 cu asimetrie negativă, comparatia fácin- 
lu-se cu repartiţia normală pentru care 8, = 0. 

Legată de asimetrie este si noţiunea de stochastic mai la dreapta. 
Mai precis fie X( Y) o variabilă aleatoare cu funcția de repartiție F(G). 
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Definiția 1.2. Vom spune că X este stochastie mai mare decit: 
Y sau Y < X, dacă 
F(x) > @(4) pentru toti ۰ 


Definiţia 1.3. Vom spune că X este stochastic mai la dreapta 
decit Y dacă 


7 > 
Ya — Yo 


Y (9) ^ J (D 


Xi e Xt 


(1.2) - - 
X — Aw 


unde Xj, X(5, At (Ya, Yio, Yæ) sint statisticile de ordine ale une? 
selecţii de volum trei asupra variabilei X(Y). 

Condiţia (1.2) nu este influenţată de poziţie şi scala. 

Momentul eentrat de ordinul patru caracterizează aplatizarea 
(boltirea) sau eu alte cuvinte arată cit de ascuţită sau de lată este 
repartiţia. 

Definiţia 1.4. Coeficientul 


(1.3) رم‎ = s 


Go 

poartă numele de coeficient de aplatizare (de exces sau kurtosis). 

Dacă 84 > 3, repartiţia poartă numele de repartiție leptokuriică 
(leptos = subţire din grecește). Densitatea acestor repartitii au vir! 
ascuţit si cozi mai lungi decit densitatea normală pentru care Pa = 3. 

Dacă B< 3, repartiţia este numită platykurtică (platys=lat) 
gi are vîrful mai turtit si cozile mai scurte decit cea normală. 

Mai folosit este coeficientul 


D Uu > E 
(1.3’) ya LUN = 
H2 *; 


care pentru repartiţia normală are valoarea zero. 

Are 106 

Definiţia 1.5. Vom spune că X este stochastic mai plată decit X 
dacă 
Yes M. Y» 
Ya LM Yu 


2 X Xo 


(1.4) - - 
X (Bit X 1 


unde Xy, Xi), Xi Lw, (Ya, Yo, Yio, Ya) sint statisticile de 
ordine ale unei selecţii de volum patru asupra variabilei aleatoare 
A (X). 
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2. Coeficientii 8, si 6. pentru unele repartitii alternative 
celei normale 


2.1. X este o variabilă lognormalá dacă are densitatea de re- 


partiție 


falti yyt o= 


—exp (Un (z — y) — 12/20 *)]) 


(2 — y) ol 2r 


æ محر‎ >0, pe R, 0>0. 


În cazul în care parametrul de localizare este nul (cazul 
mai des întilnit), avem 


VB, = (e? + 2)(e** — 1) 


= (e? T 


= و8 


1)(6 + 3e*** + 6e™ + 6) + 3. 


Repartitia lognormală are cozi lungi. 
2.2. Pentru X ~ Be(p, q), 


fy(5;p, q) = 


OO ey grt 0 <2 <1, p, qo 
Pp) Tq) 

DE q paa‏ از شم 

"hut aa) pq 
30 ate 0 stu UD i را‎ CN TE 20 


pap + + 2)(p +¢ + 3) 


repartiţia beta avind ambele cozi scurte. 
2.3. Repartiția gama (Ga(0, k)) de densitate 


,9 )رل 


bb) = 


` 09100 + 1) 


1 Ed 
سب‎ qiia 8) ar 2x.0, D> iB, e G 


2 


we o varietate de forme depinzind de valorile lui k şi 0. Avem 


cel 


Deci repartiţia gama are asimetrie la dreapta şi este leptokurticá. 
Are o coadă mai scurtă şi una mai lungă. 
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Daca k = 0 (repartiţia exponențială) 


Je فد‎ 
Jalti 9,0 ——e وه‎ > 0, 0 << 0 
0 


Deci repartiţia exponențială are asimetrie la dreapta si este lepto» 
kurtică. Are coadă mai lungă decit repartiţia normală. 


2.4. Pentru X~t(n), f(z)— - 


şi în particular 


Deci t(n) este o repartiție simetrică si leptokurtică. 
Pentru n = 1 se obţine 
al 1 1 
fa) ==: — 


T 1 Ptr a? 


şi repartiţia corespunzătoare se numeşte Cauchy. 
Repartiția t este o repartiție Pearson de tip VII cu densitatea 


f(a)— - i — —— (1 + g)", — > v « ۰ 


1 و‎ 7-1 y 
2.5. Pentru X ~ y? (n), f(z) — - e 108 . C= exe 


8 12 
BUM erre 

76 tb 
314 


(3.1) La N 


Deci x? este o repartiție cu asimetrie la dreapta şi leptokurticá. 
2.6. Pentru repartiţia Weibull de densitate 


A 1 반가 
fete; 0, 1)= k atten "2 >0,0,k 0 


avem 
` T(14-3/%) —3T (14-2/k) T*(12-1/k) —3T2(1 4-1/k) 
[T(1--2/k) — T?(1--1/k) ۶ 


(< 
N 
| 


V(1--4/k) —4T(1--3/k) P(12-1/k)--6P(14-2/k) P*(1-- 1/k) -3 P?(14- 1k) 


[(14-2/k) — I? (1--1/k)]? 


3. Teste de normalitate bazate pe statisticile 5; şi Û» 


Pentru valori mari ale lui n, variabila aleatoare 


AT 
| 


b(n-4-1) (n 
6(n—2) 


1 


wind semnul momentului m, este repartizată aproximativ N(0,1) 
4, este statistica, 


9 
m3 5 5 ور‎ El 
b = وت‎ m =— Y (a, — o) 
ms n imi 


Asimetria observată in selecție este semnificativă la pragul de 
semnificaţie « dacă 


Pentru valori mari ale lui n, variabila aleatoare 


ga 4 y MED OEI) ~ (b, — 3) E 
 n+1)]| 24n(n — 2)(n — 3) 


(3.5) uc (^ - 


este repartizată, aproximativ, N(0,1). 
b, este statistica 


m 
그 


2 
ma 


Boltirea observată în selecţie este semnificativă, la pragul de 


semnificaţie a, daca 


(3.4) 


În cazul selectiilor de volum mie se folosesc tabelele 3.1 si 3.2. 


Tabelul 3.1 


1 — F,(z) corespunzătoare statisticii Vb, în cazul norm al pentru n=4, 5, ..., 12 

folosită In verificarea normalitátii pentru alternative asimetrice 
n | dM | 

4 ۱ 3 | 6 7 8 9 10 11 12 

il | 
0,1 0,4189] 0,4394| 0,4332| 0,4335| 0,4311] 0,4295| 0,4276| 0,4258 
0,2 0,3597] 0,3787| 0,3706| 0,3686| 0,3648| 0,3614| 0,3579| 0,3544 
0,3 0,3087] 0,3180| 0,3122| 0,3069] 0,3029| 0,2979| 0,2932| 0,2885 
0,4 0,2629| 0,2572| 0,2584| 0,2515| 0,2464| 0,2408| 0,2352| 0,2297 
0,5 0,2209| 0,2070| 0,2092] 0,2029| 0,1967| 0,1909] 0,1849] 0,1792 
0,6 0,1818| 0,1675| 0,1654| 0,1608| 0,1544| 0,1486| 0,1427| 0,1370| 0,1316 
0,7 0,1451| 0,1342| 0,1278 0,1249| 0,1194 0,1136| 0,1082| 0,1030| 0,0979 
0,8 0,1104! 0,1055| 0,0987| 0,0951 0,0907, 0,0856| 0,0807| 0,0761| 7 
0,9 0,0775| 0,0807| 0,0755| 0,0712| 0,0667| 0,0635| 0,0594| 0,0554] 0,0517 
1,0 0,0461| 0,0593| 0,0567| 0,0529 0,0496| 0,0464| 0,0430| 0,0398| 8 
1,1 0,0160] 0,0412| 0,0414| 0,0388| 0,0359| 0,0333| 0,0307| 0,0282| 0,0258 
1,2 | 0,0260| 0,0291| 0,0278| 0,0257| 0,0236| 0,0217] 0,0197| 0,0179 
1,3 0,0137| 0,0193| 0,0193| 0,0181| 0,0165| 0,0150| 0,0136| 0,0123 
1,4 0,0047| 0,0118] 0,0129| 0,0124| 0,0114| 0,0103| 0,0093| 3 
1,5 0,0063| 0,0081| 0,0082| 0,0076| 0,0069| 0,0062) 0,0056 
1,6 0,0026| 0,0047| 0,0051| 0,0050| 0,0046| 0,0041| 0,0037 
1,7 0,0006| 0,0024| 0,0030| 0,0031| 0,0029| 0,0026| 0,0024 
1,8 | 0,0010| 0,0016| 0,0018| 0,0018| 0,0017| 0,0015 
1,9 | | 0,0002| 0,0008| 0,0010| 0,0010| 0,0010 0,0009 
2,0 | | 0,0000| 0,0003 0,0005| 0,0006| 0,0006| 0,0005 


Cazurile cu 7>2,1 au 1 - 


F,(z) <0, 0005. 


Mulholland (1977) 
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Punetele pereentilice ale statisticii b, pentru verificarea normalitatii fata de alternative 
nenormale datorită aplatizării 
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D'Agostino, Tietjen (1971) 
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CAPITOLUL 18 | 


TESTE BAZATE PE STATISTICI DE TIP COEFICIENT DE CORELAȚIE l 


1. Testul Filliben 
1.1. Statistica r 


Filliben (1975) propune pentru verificarea normalitatii un test 
bazat pe statistica 


(1.1) y m META — uN (M, — M) 1 
[Saw — TYM, —M (۶ 


unde {xæ}; sînt statisticile de ordine si 


M, = med {X} mediana de selecţie 


Sensul folosirii expresiei med {Xœ} ca măsură a poziţiei constă, 
în primul rind în posibilitatea folosirii medianei şi pentru repartitii 
pentru care media teoretică nu poate fi evaluată (de exemplu repar- 
titia Cauchy de densitate f(r) = "(1 + 22), we R). Pe de altă 
parte, calculul valorilor de tipul M (Xœ) este relativ complicat, 
fiindcă nu există un procedeu general valabil pentru toate repartitiile 
şi în multe cazuri sînt necesare aproximatii destul de largi. Din 
această cauză, r, astfel definit, prezintă avantajul unui calcul rapid, 
iar în cazul în care selecţia provine dintr-o populaţie normală, 7 
tinde către 1, dependenţa dintre z,(l < 1 < n) si M,(1< i< n) 
fiind liniară. 


1.2, Proprietățile statisticii r. Test pentru verificarea ipotezei compuse 
referitoare la normalitate 


Statistica r are următoarele proprietăţi : 


a) تن دم‎ 
S C, 
unde: S = ] مر(‎ — vr, CO, =[YN Mi]. 


Proprietatea rezultă: tinind seama cá 


M; yi FM La si E 0, M, PE 160) و(‎ Xi) pee statistica de 


ordine de rang i din populaţia N(0,1). 
b) r este invariantă în raport cu poziţia, şi scala 
e) r este independentă de Y si S. 00 
. Vonsecinţă : Repartiția statisticii r depinde numai de volumul 

selecţiei si de funcţia lui Laplace O(a). 

_ De asemenea, r nu depinde de parametrii necunoscuţi y (poziţia) 
ȘI o (scala) şi prin urmare poate fi folosit pentru verificarea ipotezei 
compuse privitoare la normalitate. 

d) 7 mai poate fi seris ca 


me d Y Mi(% T Tini 1) 
(2 ^ MY (v — DE 
, j 


(LE) r 


unde i [OE] A NE AA hA 


e) au loc inegalitátile 


4 


Oo 


IN 


4 


f, ; 
2 [n/(n — 1) > r <1 


“n 


f) media şi dispersia lui r sînt 


e fn m1 
> 44,1 (am) 


£y 
(1.2) M(r) = —— E. 
— bti 
y2 C, 1 (5) 
(2 
si respectiv 
E" / W ۱ ^j ni 
(1.3) Dr) = y Y, MM (ot 8747) — [M(r)}? 


(n — 1)02 


“n 


unde E, este valoarea medie a statisticii de ordine de rang 1 din 


populaţia, N(0,1) si o; reprezintă covarianta statisticilor de ordine 
de rang 7 si j din populaţia N(0,1). 


‘Tin urmare, in aplicarea acestui test, sint necesare valorile My. 
Aceste valori sint date de formula 

Mi= ®-1(m,), 
unde m, = med(U,), Ua fiind statistica de ordine de rang 1 din 
populația uniformă pe [0,1]. Pentru valorile m, se dă următoarea. 
reprezentare 


(1 — I. to 1 
SY i — 0,8175 ۲ j 
(1.4) 1 = ———— i 1 = 2, و‎ n] 
n + 0,865 
(0,5)2, LAS. 


319 


Mecanismul de aplicare a testului Filliben este deci următorul 
1) se consideră statisticile de ordine 


ay <= %2) 수 (건시. et Lin) 


2) se calculează valorile m; dupa (1.4) 
3) se calculează valorile 


M, = b-1(m,) 


4) se evaluează succesiv expresiile 


piles 1 a] "wl *. | 9 ~ .سس‎ 4 
p بت‎ >, o Y Mee Y Mi, Y (xi DY 


n 
* Mas h 
VX Mi Y )۵0 — 2) 

5) se compara 7, cu valoarea critică tabelatá de Filliben pentru 
riscul ales. În cazul in care 7, este mai mare decît valoarea critica, 
se acceptă normalitatea. 

Testul Filliben are următoarele avantaje : 

1) poate fi folosit pentru verificarea unei ipoteze compuse 
referitoare la normalitate (parametrii y şi o nespecificati) 

2) calculul statisticii r nu este influenţat de numărul de măsu- 
rători (volumul selecţiei). ADU. 

3) puterea testului este mare, atit pentru selecţii mici cit si 
pentru selecţii moderate, precum şi faţă de o clasă largă de alternative 
de diferite tipuri. 

Exemplul 1.1. (Filliben (1975)). Considerăm datele y, = 6, 


Y. = 


e 


Y — 9, Y, = 0.‏ 2 = ولا ,8 = ولا ;4— = وو ,1 < ولا 
selecţia ordonată este‏ )1 
X, 9 6, X, = 8.‏ ,5 = و4 X, = 4, Xa = —2, X, = 0, X,=1,‏ 


2) Din (1.4) gásim 
m, == 0,0943, m, = 0,2284, ma = 0,3642, m4 = 0,5000, 
mg = 0,6358, m, = 0,7716, m, = 0,9057. 


3) Din M, = P-1(m,), găsim 


M, = —1,31493, M, = —0,74388, M, = —0,34681, M, — 0, 
M, = 0,34681, M, = 0,74388 gi M; = 1,31493. 
4) Avem : 


Y, M,X, = 23,46425; Y, Mi = 4,80535; Y, (X, — X)? = 118, 
de unde 7 = 23,46425/ V (4,80535)(118) = 0,98538. 
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5) Din tabelul 1.1 observăm că r cade între punctele corespun- 
zătoare pragurilor de semnificație de 75% si 90%. Deci pe baza 
testului r nu avem o evidenţă care să ne permită sá respingem ipoteza 
de normalitate. 


2. Un test de normalitate față de alternative asimetrice 


2.1. Testul și proprietățile sale asimptotice 


Dezvoltăm un test pentru normalitate faţă de alternative asi- 
metrice folosind teorema 

Teorema 2.1. X,, X>, ..., X, este o selecție asupra unei variabile 
normale dacă $i numai dacă media de selecție X și momentul centrat de 
ordinul 2, m, sînt independente. 

Astfel, un test de independenţă pentru X şi m, este de ase- 
menea un test de ajustare pentru normalitate. Vom folosi, ca măsură 
a dependenței coeficientul de corelaţie. Testul bazat pe coeficientul 
de corelaţie este corespunzător pentru verificarea independenţei 
în repartiția normală bidimensională. Totuşi una dintre repartitiile 
marginale din cazul de faţă, şi anume a momentului centrat de ordinul 
doi nu este normală chiar dacă populaţia din care provine selecţia 
este normală. Acest inconvenient poate fi remediat prin aplicarea 
transformării rădăcină cubică (Wilson, Hilferty (1931)) celor n 
dispersii pentru a le normaliza. Datorită faptului că coeficientul de 
corelaţie este invariant la schimbările de origine şi de scară, coefi- 
cientul de corelaţie dintre cele n medii de selecţie şi rădăcinile cubice 
ale dispersiilor de selecţie corespunzătoare este egal cu r, coeficientu 
de corelaţie dintre X, şi Y, unde 


(2.3) Y, = "(n UY Xj — (Y XUR —1)]p2, EN و...‎ ۰ 
jti j*i 
Valorile lui 7? anormal de mari pun la indoialá normalitatea lui X, 


În cele ce urmează vom considera repartiţia asimptotică in 
ipoteza nulă a statisticii r. Fără a pierde din generalitate presupunem 
CĂ Xis Xa, ...,X, sint variabile aleatoare independente identic 
repartizate cu M(X,) = 0, M(X) =1 si scriem u, = M (XD), k = 
— 84.0.06. 


Teorema 2.2. Dacă uz = 0, pentru n — co, statistica 


AN f A — X) (x, — DN Y, (X, — Ey (Y, — (۶ 


21 ~ c. 271 321 


8660 ] 8660 | 9660 | 9660 | 46610 | 966*0 566 °0 | 8660 | 6860 | L860 | ۴86 0 | 1860 6.60 | 6960 | ۴ 
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este repartizată normal cu valoarea medie zero si dispersia 
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Corolarul 2.1. Dacă X,, Xs, ..., X, este o selecţie asupra unei 
variabile normale, atunci, asimptotic, r ~ N(0,3/n). 

Teorema 2.3. Testul bazat pe coeficientul de corelație v este con- 
sistent faţă de toate alternativele simetrice cu primele patru momente 
finite. 


(2.3) Dr) = 


۱ 


2.2. Testul de normalitate 2 
În selecţii de volum moderat din populaţia normală bidimen- 
sională r (transformarea Z a lui Fisher) nu este (este) repartizată 
normal. Acesta este motivul pentru care statistica, 
「 1 l7 Kr RE à 
(2.4) Mies rome In——— (r dată de (2.2)) 
2 — T 
este folosită ca bază a unui test de normalitate (vezi tabelul 2.1) 
Respingem ipoteza de normalitate dacă 


[Z| > constantă 
Teorema 2.4. Dacă X,, ..., X, este o selecție asupra unei varia- 


bile normale, atunci Z ~ N(0,3/n). 
Simulările au arătat că chiar pentru valori mici ale lui n Z poate 


fi considerată N(0, c2), unde ۰ 
(2.5) of = 3/n — 7,824/n? + 53,005 /n?. 
Avem 
(2.6), LUZ! > 0) PZ} os 20/04) = 2 — 2P( Blog 0/0) 2 
~2— 2| oclo) et = (0 on)? — 3(0/0.)) 00090 | ’ 
unde 
(2.7) ` Yə = —11,70/n +55,06/n? 
şi 


Valorile lui 2, 2, — as 1 
PR 


0,000 
0,010 
0,020 
0,030 
0,040 
0,050 
0,060 
0,070 
0,080 
0,090 
0,100 
0,110 
0,121 
0,131 
0,114 
0,151 
0,161 
0,172 
0,182 
0,192 
0,203 
0,213 
0,224 
0,234 
0,245 
0,255 
0,266 
0,277 
0,288 
0,399 
0, 310 
0, 321 
0, 332 
0, 343 
0,354 
0, 365 


00,57 
' 0,58 


Tabelul 


0,36 
0,37 
0,38 
0,39 
0, 40 
0,41 
0, 42 
0, 43 
0,44 
0,45 
0,46 
0,47 
0,48 
0,49 
0,50 
0,51 
0,52 
0,53 
0,54 
0,55 
0,56 


0,59 
0, 60 
0, 61 
0,62 
0,63 
0, 64 
0,65 
0, 66 
0, 67 
0, 68 
0, 69 
0, 70 


2.1 


0,377 
0,388 
0, 400 
0,412 
0, 424 
0, 436 
0, 448 
0, 460 
0, 472 
0, 485 
0, 497 


0,510" 


0,523 
0,536 
0,549 
0,563 
0,576 
0,590 
0,604 
0,618 
0, 633 
0,648 
0, 662 
0, 678 
0, 693 
0, 709 
0, 725 
0,741 
0,758 
0,775 
0, 793 
0,811 
0,829 
0,858 
0,867 


3. Subprogram FORTRAN pentru teste bazate pe 
coeficientul de corelaţie 


1. Pentru testul Filliben calculul valorii lui r, se face prin pro- 


cedeul expus în paragraful 1. Subprogramul funcţie RO calculează | 


această valoare. Schema logică a subprogramului este data în fig. 18.1. 
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میتی 


S1=51+(X (1) -XM)? 
X2=(1-0,3175)/(N+0,365) 


X3=U ALFA (1- X2) 
S2=S2+X3-X(1) 
S3:53+X3 


RC=S2/VS3-S1 
RETURN 


Fig. 18.1 | 


FUNCTION RC(X,N) 
DIMENSION X(N) 
XM =Ø. 

DO1I =1,N 

XM = XM + X(1) 
XM = XM/FLOAT(N) 


X2 = (I — 9.3175)[(N + 8.365) 
IPF(I.EQ.1) X2 = 1.—(9.5)u*(1./PLOA T(N)) 
IF(I.EQ.N) X2 = (Q.5)s«(1.[FLO A T(N)) 
X3 = UALFA(1.—X2) 
82 = 82 + X3 * X(I) 
83 = 83 + 9 

| RO = 82/SQRT(S3x81) 
RETURN 

| END 


bo 


unde : 
X — vectorul statisticilor de ordine (real) 
N — dimensiunea vectorului X (întreg) 
Se foloseşte in calcul subprogramul funcţie UALFA (capitolul 3, 


paragraful 4, punctul 6) pentru calculul valorilor ©-1(m,). (subpro- 
gramul calcula valoarea lui -1(1— a)). 

Un program principal pentru acest subprogram este analog 
cu programul din capitolul 14, paragraful 6, punctul 2 în afară 
de faptul că instrucțiunea a opta se înlocuieşte cu : 


I| W = RO(X,N) 


şi se modifică formatul de scriere. 
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CAPITOLUL 19 


U — STATISTICILE ÎN VERIFICAREA IPOTEZELOR DE CONCORDANŢĂ 


1. Introducere 


Fie X,, رو‎ , X, o selecţie asupra unei variabile ا‎ a 
Hie Aor Aa aa bie | 1 0000 
ce depinde de un parametru 0181 میگ‎ Aa > + 1 Xm) un bags id 
nedeplasat pentru parametrul 9, unde m este cel um mie n 
de observatii necesar pentru estimarea parametrului 0. ^ 
in aceste condiţii există o funcţie simetrică de f( Xa, Xn 00290 
dată de ^ 
f* CX, Xs ns Xm) = REUS dat f( Xa, Xin -- Xi) 
; m! 
unde sumarea se face după toate cele m! permutări ale indicilor. 
U — statistica pentru parametrul este 
i 1 ee 
, Xa) m Uf, (Ki Kay oes Ain) 
ca 
n ] 1 
unde sumarea se face după toate combinările de n întregi luaţi cite 
m (v jas di das RATIA 
U — statistica este nedeplasată : 


1000 Soy بر ی‎ aE oe 


U(X,, Xs, ° 


Fie 
JE (ay) Day ۰۰ و۰‎ Ve) = 


9 = | d ی‎ == Das wa» X = 7 . 
로 | ~ (X, ees Xo Xorn utu Xal X, Mig. X, Ta AA 00 


si ۳ 
) PO $ کے ود‎ 

C, = D ff(Xy BL A 0 < loh A p 

Á ă á e d st statistică 

Hoeffding (1948) a arătat că dacă PX, zo. و۰‎ Xm) eri 7 "s 
cu valori reale simetrică cu media 0 81 momentul de ordinu 2 ; 
atunci cind n > oo, /n(U — 9) are asimptotic o repartiție N(0,m m 
— . În acest capitol vom prezenta teste pentru verificarea norma 
13111 bazate pe U-statistici. 
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2. Verificarea normalitatii față de alternative nesimetrice 


Considerăm statistica, 
(2.1) Tia Ul 


unde 


(2.2) Uu rm Y; 9, (Xo; Xi, Xw) 
k=j+1 


este o U — statistică invariantă cu 
(2.3) ; O CX, Xo, Xw) a (Xa Sa X)? mp 
1 


n — 1 
statistică) pentru sc? si 


p este ales astfel încît 7, este invariantă faţă de transformările 
de poziţie şi scală. 


(Xi at Xo), 


DA 


M duse X)* este estimatorul nedeplasat (o U — 
1 


Daca selecţia este făcută asupra unei repartitii simetrice, repar- 
tilia statisticii T,, este simetrică faţă de zero. Valorile pozitive 
(negative) ale lui T,, indică asimetria, la dreapta (stinga) 

Teorema 2.1. Dacă Xi; X,, . 
variabile X ~ N(u, 02), atunci 


.., X, este o selecție asupra unei 


m as 1 
EC = 0, PUTI ea, DAT ya) E (a, + 34.) 
si pentru n > 5. 


D*( Pin) = 3!(n — 3)! (n !)-1 {a,4+3(n—3)a.+1,5(n—3)(n—A4) as), 
p = 1, 2 unde dı, da gi ag sînt aproximativ 1,03803994; 0,23238211 
respecto 0,05938718 pentru p =1 gi 7,03804; 1,77417 respectiv 
0,49608 pentru p = 2. 

Pasii în obţinerea statistieii T,, sînt 

~ 1 D Im 

1. Se calculează S? = 2 Y (X, — T), 8 = VS? 
2. Be seriu statisticile de ordine Xu) < Xp < .. 


. > Am 
3. Se calculează U,, după formula 


i Lou i 
9 4 AS yy 
(2.4) Din F 여서 1 să (0 5 
unde 


Wy = 06, — 2(n — i) (1 — 1) + Ci_,, €? = ala >b) 
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4. Se face raportul dintre U,, si ۰ 

Pentru obţinerea statisticii Tan, parcurgem etapele 
I. Se calculează S? 

II Identic cu 1 de la Tin 

III Se calculează Un după formula 


1 n-1 n d 1 
(2.5) Un = 5 Y VX — X»)*, 
Ci de Sei 
unde 
Pasii اس‎ a i 

IV. Se face raportul dintre Uz, şi S?. 

Pentru obţinerea funcţiilor critice ale testului bazat pe Ti, 
(Ton) se foloseşte o repartiție normală de valoare medie zero şi dis- 
persie DY(T,, [DAT 2n)]. In tabelele 2.1 gi 2.2 se dau punctele critice 
gi pragurile de semnificaţie rezultate din această aproximaţie. 


Tabelul 2.1 


Praguri de semnificație empirice folosind aproxim atia normală eu Tin $i T, 


——— 


M —— M M —— 


Tin Ton 
n ن‎ n 
10% 5% 25% 1% 10% 5% 2,5% 1% 

مس سس — 

12 [0,1028 | 0,0492 | 0,0237 | 0, 0076 20 | 0,0915 | 0,0432 | 0, 0206 | 0, 0072 

20 | 0,1033 | 0,0522 | 0,0249 | 0, 0091 40 |0,0970 | 0,0466 | 0,0218 | 0,0095 

25 |0, 0999 | 0, 0514 | 0, 0242 | 0, 0082 50 [0,0993 | 0,0499 | 0,0250 | 0,0114 

30 | 0,1010 | 0,0507 | 0,0222 | 0,0093 60 | 0,0995 | 0,0499 | 0,0237 | 0, 0091 

40 | 0,1032 | 0,0513 | 0,0246 | 0,0091 70 |0,1004 | 0,0518 | 0,0248 | 0, 0086 

60 |0,1050 | 0, 0513 | 0,0253 | 0,0099 80 | 0, 0960 | 0, 0491 | 0,0255 | 0,0111 
100 | 0,1022 | 0,0515 | 0,0248 | 0,0097 100 | 0,0996 | 0, 0504 | 0, 0252 | 0,0098 


Tabelul 2.2 


Punctele critice superioare pentru T,, Şi Tan standardizate (obţinute prin simulare) 


———————— 


d Tin Ton 

n —Ó——————— ———————— 

10% 5% ۵ 1% 10% 5% 2,5% 1% 

ce‏ اما کف iapa‏ "لے 
| 

10 1,319 1,657 1,909 | 2,190 1,189 1,502 1,772 2,055 
15 1,300 1,644 1,902 | 2,200 1,203 1,516 1,'780 2,108 
20 1,301 1,657 1,958 | 2,302 1,225 1,569 1,905 2,212 
30 1,289 1,653 1,914 | 2,293 1,243 1,590 1,879 2,259 
50 1,310 1,625 1,978 | 2,364 1,277 1,644 1,961 2, 387 
60 1,314 1,658 1,962 | 2,319 1,280 1,643 1,924 2,290 


Locke Spurrier (1976) 
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3. Verificarea ipotezei Ho: F(w) = G(ax + b) pentru toti 2 si a >0,b 
cu G dată fata de alternativele (17.1.2) si (17.1.4) 


Dacă considerăm U-statisticile 


1 


1 Aw — X 
(3.1) Pym E 


unde suma se ia după 1 < > <k > ۷ şi 


2 


(3.2) quee 1 y Xu "E Xo 
C; Xo D Xo 
unde suma se ia după 1 < i <j <k < ک>‎ n, atunci are loc 


Teorema 3.1. i) Statisticile T, si T, sînt invariante fată de trans- ۱ 
formările de poziţie si scală 


ii) Statisticile T, si T, sint estimatori eficienţi pentru 


(3.3) Y, (4) ES u (xe = x) 
X» — Xa) 


unde Xo, Xi», Xi), sînt statisticile de ordine corespunzătoare unei 
selecții de volum trei asupra lui F si respectiv 


(3.4) (8) = u (Zoe) 
Xa ju Xo 


unde Xay X 2), Xo Xw sînt statisticile de ordine corespunzătoare unei 
selecții de volum patru asupra lui F 


۱ _ iii) Repartiția comună limită a statisticii (T,, Ta) este normală 
bidimensională de vector valoare medie (4,(F), )وب‎ (( 


: iv) Dacă F este simetrică, T, si T, sînt necorelate și deci indepen- 
ente 


v) Asimptotic, statistica 


(8.5) g — WOT (Ta — e Y 20 
D¿(T,) Dil T3) 4 
vi) Testele bazate pe T, si T, sînt consistente faţă de alternativele 
(17.1.2) și respectiv (17.1.4). 
Pentru verificarea ipotezei Ho 
i) faţă de (17.1.2) ((17.1.4)) folosim statistica T,(72) 
ii) testul bazat pe S este un test de ajustare omnibus. 
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4. Subprogram FORTRAN pentru verificarea normalitátii 
fata de alternative nesimetrice 


1. Verificarea normalitátii fata de alternative nesimetrice se 
face pe baza statisticii Tp» calculate din formulele (2.1—2.3). Pentru 
calculul acestei statistici am seris subprogramul funcţie TPN a cărui 
schema logică este data în fig. 19.1 


[m 151,. 2.4, N 
| 
| 
L 


XM=XM +X (1) 


` XM=XM/N 
SsO 


2 


| 
il 


x2-(xuo-x o" 
TPN=TPN+X2-X1 


FUNCTION TPN(X,N,P) 
DIMENSION (X(N) 
OM =, 

DOI T= 1,N 

AM —XM--X(I) 
XM=XM/FLOAT(N) 
i. 

DOSTAN 
X1—X(I)—XM 

S = S--X1«X1 

S —S«x( —O.5x P) 

EPN SE. 

N1-—N-—2 

DO Bl = LNI 

N2 = N-1 

71 = I +1 

DO 3J = 11,N2 

X1 = (X(J)— AU) P 
JI pu 

DOZE eS TN 

X2 —(X(K) — X(J))**P 
TPN = TPN + X2—X1 
TPN = TPNxSx6/(N*(N —1)u(N —2)) 
RETURN 

END 


X — vectorul statisticilor de ordine (real) 
N — dimensiunea vectorului X (întreg) 
P — parametru al statisticii T, (real) 
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2. Un program principal pentru folosirea acestei statistici este 
următorul : 


|| DIMENSION X(509) 
| | READ(195,1) N,P 
1|| FORMAT(A,F6.2) 
READ(195,2) (X(I),I = 1,N) 
2|| FORMAT (10F8.4) 
CALL SORT(X,N) 
|, T = TPN(X,N,P) 
| WRITE (18,3) T 
3 FORMAT( STATISTICA TPN ESTE',F15.6) 
STOP 
| END 


Se folosesc subprogramele SORT (capitolul 5, paragraful 11, 
punctul 1) si 7 PN de mai sus. Datele pe cartele se prezintă astfel : 
prima cartelá conţine valoarea lui N (coloanele 1—4) şi a lui P (co- 
loanele 5—10 din care ultimile două sint zecimale) iar pe cartelele 
următoare apar valorile statisticilor de ordine cîte 10 pe o cartelă 
fiecare ocupind cite 8 coloane (patru zecimale). La imprimantă apare 
valoarea statisticii Tn. 
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CAPITOLUL 20 


COMPARAREA TESTELOR DE NORMALITATE 


1. Introducere 


În toate cazurile proprietăţile noilor statistici test sint comparate 
cu proprietăţile statisticilor test existente, folosindu-se selecții 
dintr-o varietate de situaţii nenormale. 

Cel mai simplu mod de a compara două sau mai multe teste 
pentru verificarea unei ipoteze date faţă de o alternativă dată pentru 
o selecţie de mărime fixată este examinarea directă a puterii lor. 

Definiţia 1.1. Puterea testului pentru verificarea ipotezei nule 
H, față de ipoteza alternativă H este probabilitatea de a respinge 
ipoteza H, fiind adevărată ipoteza H. 

În 8 2 se compară testele de normalitate introduse în capitolele 
anterioare, punindu-se în evidenţă superioritatea unuia sau altuia 
în funcţie de alternativele considerate. 

În $ 3 se introduce conceptul de suprafață sensibilă stilizată 
cu ajutorul căruia se obţine o metodă grafică de compararea testelor 
de normalitate. 


2. Compararea puterilor 


2.1. Compararea testelor W?, 42, Pearson și b, prin transformarea datelor 
inițiale în variabile ¢ (teorema 12.3.1.) sau în variabilele U(0, 1) 
(teorema 12.3.8) 

S-au folosit alternativele a) U(—/3,//3) b) 32(2), e) Cauchy de 
densitate x-1[1/(1 + 22)] d) Laplace de densitate T exp (—| 21), 
e) Logistică de densitate sech? (/d)/2d, d = | 12/x f) Lognormalá 


pentru care Y — log X ~ N(0,1) şi g) Weibul (2) de densitate 
2» exp(—2a?), v << ۰ 
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Asupra fiecáreia din aceste alternative s-a considerat o selectie 
de volum n. Folosindu-se teoremă 12.3.1 s-au transformat cele n 
variabile de selecţie în variabile 7 si apoi in (n—2) variabile U(0,1). 
W? s-a calculat după (6.1.6), 4? după (8. 6.1), Pearson y? după 
(12.3.6) şi b, după m3/m3 (§ 3 Cap. 17). 

Rezultatele obţinute (tabelul 2.1 (Csórgó, Seshadri, Yalovsky 
(1973)) arată că teorema 12.3.1 nu constituie o metodă bună pentru 
verificarea normalitátii. Explicaţia care s-ar putea da este următoarea : 
deoarece variabilele t transformate sînt numai independente $i nu 
identic repartizate procedeul de a aplica transformarea integrală 
la variabilele ¢ şi apoi de a verifica uniformitatea poate să nu fie un 
procedeu corespunzător pentru cazul de faţă. 

O altă metodă de verificare a normalitátil se bazează pe teorema 
12.3.5 care dă teste foarte puternice pentru alternativele simetrice 
cum ar fi Cauchy, Laplace şi Logistică şi teste cu putere mică pentru 
repartitii asimetrice. Repartitiile alternative folosite au fost: 
B(2,1), x2(1), Johnson SB (y, 3): y + ۵ log [2/(1 + 2)] ~ N(0,1), 
0 < a» > 1, Tukey (3): X = U^— (1 — Uy, U ~ N (0,1) si Weibull 
(0,5). 


2.2. Compararea testelor W gl 4% cu testele D,, Wi, Ur, V, او‎ E, 


Fie F funcţia de repartitie a unei variabile aleatoare X ~ 
N(u, 62). Dacă u si o? sint necunoscute (cazul I), atunci estimam 
F prin 


(2.1) F(a) = o( ae *) 
8 


n 
unde s? = ( fire 2y/(n — 1). Dacă nu este cunoscut parametrul 


1 
o? (cazul II) atunci estimám F prin 


Puterile testelor W (14.2.2), D, (5.2.1), W2(6.1.6), A4} (8.6.1) 
U2(7.1.3), V,(8.1.1), E, = Y, max(D?, 27 (Df si Dr date de (5.2.3)) 


i=1 
cu F(x) înlocuit prin (2.1) sau (2.2) sînt date în tabelul 2.2 (Dyer 
(1974)). 

Puterile au fost obținute prin simulare, pentru fiecare volum al 
selecției folosindu-se 500 de selecții şi pragul de semnificație indicat. 
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Tabelul 2.1 


Uniforma | 0,0 5 
282) 0:52"|0;14- 1 0,17:]0, 26 0,7 0,18 | 0;21 | 0,26 
Cauchy 0,66 | 0,21 | 0,30 | 0,21 0,76 | 0,31 | 0,42 | 0,26 
Laplace 0,.99 |] 0,13 | 0,13 | 0; 31 0,13.1:0,12 |:0,12:110,48 
Logistică 0,19 10,11 WO; 0,19 | 0,1 0,10 | 0,11 
Log Normalá | 0,66 | 0,16 |:0,20 | 0,3t 0,84 '| 0,22 | 0,31 1000.33 
(07,1) | 
Weibull (2) 0,18 | 0,10-| 0,11 | 0,14 || 0,21 | 0,10 | 0,11 | 0,16 
(e) (0) 
| n = 20 | n = 25 
Alternativa 2 | E 2 
b, Wa A | A | b; | Wa A x 
| Li 
] | : | 
Uniforma 0,02 | 0,10 | 0,12 | 0,10 | 0,01 | 0,00 | 0,12 | 0,09 
x? (2) 0,81) | 0,225) 05.28 100,28 | 0,90 | 0,26 | 0,36 | 0,29 
Cauchy 0,82 | 0,42 | 0,51 | 0,25 || 0,87 | 0,55 | 0,65 | 0,24 
Laplace 0,33 | 0,16 | 0,15 | 0,14 0,37 | 0,16 ۱۰0,16 | 0,13 
Logistică 0,20| -0,13..1:0; 125 0; 11 0,22 | 0,13 | 0,12 | 0,12 
Log normala 0,91 |.0,31 | 0,43) 10.33 110,97-1:0,3751/ 0; 55. 140.87. 
(0, 1) 
Weibull (2) | 0,24 | 0,11 | 0,12 | 0,15 0,29 1-010710, 11:170;18 
(e) 
n = 30 
Anlternativa | 2 | A 
bi | Wa A x 


Uniforma | 0,02 | 0,09 | 0,11 | 0,08 
x? (2) 0,94 | 0,37 | 0,47 | 0,30 
Cauchy 0,86 | 0,62 | 0,72 | 0,22 
Laplace 0,87..1:0,16 10,15 1-0, 1 
Logistică 0,23 ۱010۱ 0,10 ۵9 
Log normală 0,98 | 0,46 | 0,67 | 0,36 
(0,1) | 
Weibull (2) ۲ 0,35 | 0,12 | 6,11 ۵ 


Pentru toate cele patru alternative considerate puterea testelor 
cu u şi c? necunoscuţi este mai mare decit puterea testelor numai cu 
c? necunoscut. Testele W şi AZ sint superioare celorlalte teste 
considerate, W fiind un test mai bun pentru alternativele : uniformă 
şi exponențială şi 42 fiind putin mai bun pentru alternativele dublu 
exponențială si Cauchy. 
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Tabelul 2.2 


Puterea (x100) pentru W, TR Wi, Days Ens UZ, Şi V, ca teste pentru normalitate; cazul 
unu fata de cazul doi 


| 2 


w| a Wa Do En Un Vn 
Alternativa et pit 00000 00 
ولا‎ 02 o? lu, o?| c? | o°] c? Iu, 02| o? lu, 02| c? | ولا‎ c? c? |u, o 
| 
Uniformă 15|:27 116) 27 |: 15| 20: [181117 1 1220 
a= 0,10 20| 39 | 14| 34 | 14| 26 | 17| 18 | 13| 29 24 28 25 24 


25| 44 | 20| 41 | 18| 31 | 23| 22 | 15) 33 
35| 75 | 26| 55 | 25| 46 | 28) 33 | 19) 51 


Exponentialá | 20| 83 | 30| 79 | 27| 71 | 31| 58 | 27| 79 63 72 64 68 
0 = 0,05 25| 94 | 34| 89 | 32| 84 | 36| 67 | 26| 85 


1024 | 8125 8947] 의 28.1 7124 | 13 ۰ 35 18/24 
Dublu expo- | 15| 29 | 12| 32 | 9| 31 | 12| 27 | 8| 2 
nentialá 20| 34 | 10| 37 | 10] 35 | 12/ 31 | 8/35| 25 34 29 34 
&—0,10 | 25] 38 | 12) 44 | 11| 41 | 17| 35 | 9| 42 
35| 43 | 19| 54 | 19| 52 | 23| 44 | 15| 54 
| | 
101.68 | 30| 70 | 28| 69 | 27| 67 | 22] — | 55 66 57 08 
Cauchy 15| 81 | 55| 84 | 47| 83 | 52| 80 | 45| — 
«= 0,10 | 20| 90 | 69| 91 64 90 | 67| 88 631 | 84 .92 85 89 
25| 94 | 79| 95 | 761 95 | 78| 93 | 74| — 


2.3. Compararea testului Z cu testele D, Wî, W sl b 


Pentru fiecare din repartitiile alternative considerate s-au simu- 
lat 1000 de selecţii de volum n = 10, 20, 30, 50 şi pentru Z s-a folosit 
(18.2.4.), pantra D, (5.2.1), pentru W2 (6.1.6), pentru W (14.2.2) 
şi pentru by: m3/m3 $ 3 (Cap. 17). 

Din studiile făcute rezultă că exceptind repartitiile cu cozi 
lungi, testul Z este fie superior, fie comparabil ca putere cu toate 
celelalte teste (tabelul 2.3). Testul Z dă rezultate bune chiar şi în 
cazul alternativelor simetrice cu cozi lungi. 


82.4. Compararea testelor Tin și Ta, (19.2.1) bazate pe U-statistici cu testul 
bazat pe statistica 5, 


Pentru fiecare alternativá si volum de selectie au fost simulate 
200 selecţii cu ajutorul cărora s-a estimat puterea. In cazul reparti- 
tilor cu amindouá cozile mici (beta, Johnson Sg), Tin este superior 
lui b,. Pentru repartitiile cu o coadă mică şi una mare (Weibull, 
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Tabelul 2.3 


Estimaţia (prin simulare) a puterii unor teste de normalitate : «= 0,05 


Populaţia pi? | Ba n Di w? Ww pe? Z 
Normală 0 3,0 | 20 | 0,047| 0,064! 0,057| 0,057| 0,049 
(cazul nul) 30 | 0,043| 0,037| 0,043| 0,051| 0,048 
B (2,1) —0,57| 2,4 | 20 | 0,165| 0,226| 0,321] 0,113} 0,230 
30 | 0,251| 0,359} 0,524] 0,170| 0,365 
B (3,2) —0,29| 2,4 | 20 | 0,055| 0,052| 0,065| 0,028| 0,044 
30 | 0,082| 0,083| 0,107| 0,039| 0,060 
Weibull 0,63} 3,3 | 20 | 0,102| 0,112| 0,156] 0,145| 0,153 
(a = 2) 30 | 0,137] 0,160| 0,231] 0,207] 0,263 
Weibull 6,62] 87,7 | 20 | 0,984] 0,994] 1,000, 0,983] 0,998 
(a = 0,5) 30 | 1,000] 1,000| 1,000] 1,000| 1,000 
Exponential 2,00} 9,0 | 20 | 0,601} 0,739} 0,842] 0,706] 0,823 
30 | 0,777] 0,898] 0,965] 0,894] 0,955 
T(2) 1,41| 6,0 | 20 | 0,345| 0,433| 0,503| 0,498| 0,551 
30 | 0,445 0,569| 0,714| 0,649] 0,740 
T(3) 1,16| 5,0 | 20 | 0,222! 0,301] 0,390| 0,374 0,430 
30 | 0,332} 0,436| 0,565| 0,538] 0,620 
Lognormală 1,80 
1 
(+=) 8,9 | 20 | 0,346| 0,434| 0,526] 0,501| 0, 549 
30 | 0,471] 0,581| 0,688] 0,681| 0,738 
Lognormalá 6,20|113,9 | 20 | 0,785| 0,874| 0,934| 0,860| 0,925 
1 30 | 0,934| 0,974| 0,989] 0,967| 0,989 
-+ 
2 
t neecentrat a — 20 | 0,584| 0,638| 0,683] 0, 657| 0,638 
(82 1,4 = 2) 30 | 0,734| 0,791| 0,801| 0,779| 0,740 
t ncentrat 20 20 | 0,248| 0,297| 0,355| 0,373| 0,351 
(8=1,v= 4) 30 | 0,333] 0,405] 0,443] 0,466] 0,416 
gama, exponențială, lognormală), Tin este mai bun, iar pentru 


repartiţiile cu amindouá cozile mari, (Johnson, Sua, t necentrat, 
valoare extremă, 고) b, este mai bun. 

În obţinerea acestor rezultate (tabelul 2.4) (Locke, Spurrier 
(1976)) s-au folosit punctele critice pentru n = 20 81 n = 50 81 apro- 
ximatia normală pentru n = 100. În tabel sînt incluse gi comparații 
pentru statistica Tos. 


2.5. Compararea testelor bazate pe statisticile Tı, T, gl S ((19.3.1), (19.3.2) 
şi (19.3.5)) cu testele bazate pe statisticile W gl b, 


S-au generat 2000 de selecţii de volum n = 20 din următoarele 
populații: Weibull (2), exponențială, lognormală (co = 0,5), log- 
normală (o = 1) (alternative asimetrice), logistică, Laplace, Cauchy, 
uniformă (alternative de aplatizare sau de kurtosis). 


338 


Tabelul - 2.4 


Estimatia puterii (Metoda Monte — Carlo) pentru teste unilaterale cu pragurile de 
semnificaţie 0,05 şi 1,01 


n Repartiția 0,05 0,01 0,05 0,01 0,05 0,01 
20 |B (1,2) 0,275 0,035 | 0,355 0,160 | 0,330 0,100 
50 0,500 0,110 | 0,750 0,455 | 0,070 0,260 

100 0,835 0,430 | 0,970 0,845 | 0,930 0,740 
20 |B (2,3) 0,065 0,015 | 0,110 0,035 | 0,080 0,020 
50 0,145 0,000 | 0,245 0,070 | 0,215 0,025 

100 0,280 0,040 | 0,450 0,205 | 0,365 0,120 
20 |JohnsonSg | 0,115 0,010 | 0,375 0,135 | 0,260 0,070 
50 |y = 0,3301 0,215 0,050 0,600 0,320 0,405 0,145 

100 |3— 0,4835 | 0,505 0,125 | 0,880 0,715 | 0,750 0,480 
20 |Johnson Sg | 0,450 0,150 | 0,750 0,500 |. 0,630 0,360 
50 |y= 0,6503 | 0,850 0,430 | 0,985 0,920 | 0,940 0,740 

100 |3.— 0,4946 | 0,985 0,930 | 1,000 1,000 | 1,000 0,980 
20 |Johnson Sp | 0,150 0,020 | 0,170 0,015 | 0,170 0,025 
50 |y — 1,336 0,275 0,060 | 0,275 0,090 | 0,275 0,060 

100 |8 = 1,973 0,505 0,200 | 0,555 0,280 | 0,540 0,275 
20 |Johnson Sp | 0,295 0,095 | 0,290 0,110 | 0,295 0,105 
50 ly = 3,102 0,665 0,400 | 0,710 0,400 | 0,715 0,395 

100 |8 = 2,082 0,905 0,745 | 0,940 0,770 | 0,920 0,785 
20 |Weibull 0,070 0,015 | 0,065 0,005 | 0,075 0,005 
Si xus 0,095 0,015 | 0,075 0,010 | 0,090 0,010 

100 0,140 0,035 | 0,155 0,035 | 0,145 0,085 
20 [Weibul 0,240 0,090 | 0,285 0,115 | 0,245 0,050 
so ja? 0,515 0,225 | 0,575 0,260 | 0,575 0,240 

100 0,800 0,530 | 0,845 0,575. | 0,845 ۰ 5 
29 TD 0,800 0,610 | 0,895 0,720 | 0,850 0,655 
so |exponenţială | 9 995 0,975 | 0,995 0,995 | 0,995 0,985 

100 1,000 1,000 | 1,000 1,000 | 1,000 1,000 
20 |TQ) 0,620 0,930 | 0,670 0,470 | 0,660 0,445. 
50 0,950 0,850 | 0,970 0,910 | 0,965 0,895 
100 1,000 0,995 | 1,000 1,000 | 1,000 1,000 


Tabelul 2.4 (continuare) 


b, Tin Ton 

Repartitia 0,05 | 0,01 0,05 | 0,01 0,05 0,01 
T (a) 0,365 0,140 0,375 0,145 0,380 0,170 
0,715 0,410 0,675 0,425 0,735 0,430 

0,940 0,750 0,920 0,815 0,945 0,800 

Log-normala 0,305 0,145 0,260 0,120 0,300 0,150 
ots AAs 0,025 0,405 0,585 0,340 0,640 0,370 
0,855 0,625 0,840 0,630 0,880 0,670 

Log-normală 0,553 0,290 0,585 0,335 0,570 0,355 

> 

c? = 4 0,945 0,780 0,955 0,830 0,950 0,815 
1,000 0,985 1,000 0,995 1,000 0,995 

Log-normalá 0,910 0,760 0,975 0,900 0,970 0,84 
aa 4 1,000 1,000 1,000 1,000 1,000 1,000 
1,000 1,000 1,000 1,000 1,000 1,000 

F (10, 10) 0,790 0,570 0,815 0,640 0,810 0,640 
0,995 0,955 1,000 0,985 1,000 0,980 

1,000 1,000 1,000 1,000 1,000 1,000 
F(x) = 0,455 0,165 0,440 0,215 0,455 0,205 

= 1 —exp(—e72) 0,770 0,565 0,820 0,575 0,790 0,585 
(Val. extremă) 0,995 0,945 0,995 0,945 1,000 0,970 
t necentrat 0,655 0,510 0,645 0,485 0,650 0,525 
$= 1,2 0,920 0,870 0,910 0,845 0,915 0,870 
0,940 0,935 0,950 0,935 0,945 0,940 
t necentrat 0,220 0,095 0,205 0,050 0,225 0,095 
eH. 0,485 0,330 0,425 0,190 0,480 0,270 
0,660 0,520 0,570 0,395 0,665 0,500 
Johnson U 0,155 0,055 0,120 0,050 0,145 0,060 
Y — —0,6304 0,220 0,110 0,165 0,070 0,200 0,080 
8 — 2,492 0,395 0,215 0,340 0,140 0,395 0,180 
Johnson U 0,250 0,145 0,235 0,085 0,250 0,135 
8 — —0,4318 0,440 0,260 0,330 0,145 0,380 0,215 
8 — 1,585 3t 

,585 0,690 0,520 0,575 0,330 0,675 0,455 
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S mnificatie to i= 0,05 


Pe baza acestor: selecţii si la un prag de 
E 


s-au estimat puterile testelor, obtinindu-se tabelul 2.5. 


Tabelul 2.5 


| | | | | 
1 | TOT TNT jS MN TE S 
| | 8 | 
| | | 
AO E = Nes 
Weibull (2) | 0,156 0,145 | 0 | 0,116 
exponentiala | 0,842 | 0,706 0 } 0,776 
lognormala | | | 
(c = 0,05) ۱۱ 00 526 9.0: 504. | 0,6: | 0, 
lognormal | | | 
(6 = 1} | 0,866 | | 0,955 | 0,900 
logistică | | | + 05182. || 0,090 
Laplace | | K 
Cauchy | | | | | 0,83: 
uniformă | | | | | 0,234 


3. Suprafete sensibile stilizate 


1 ^ SS 
escrise in detanu 
979) de 
(1972) dau o 


si sint ver- 


X 


Curbele sensibile, propuse de Tukey (1970) si « 
de Andrews, Bickel, Hampel, Huber, Rogers, Tukey 
indicatie a sensibilităţii estimatorilor la erori grosol 


+ 


Curba sensibilă pentru un estimator bazat pe n 
obţine adáugind un punct v care alunecă la n | statistici de ordine 
normale dintr-o selecţie de n — 1 observaţii şi prin calcularea esti- 
matorului din această pseudoselectie. 

Suprafaţa sensibilă, sugerată ca aici, este o extensie a acestei 
idei si constă în a evalua statistica test pentru o selecţie de volum n 
formată din n — 2 statistici de ordine normale împreună cu două 
puncte 2, si 4, care alunecă şi care variază independent pe dreapta 
reală. Structurile de selecție produse în acest mod includ toate com- 
binatiile de configurații cu cozi lungi si cozi scurte, simetrice si oblice. 

Suprafaţa sensibilă pentru un procedeu test este graficul tri- 
dimensional al valorii obţinute pentru statistica test ca functie de 
æy 8i 26. Contururile sensibile în planul (21, xv.) pot fi construite cores- 
punzind la cuantilele repartitiei statisticii test în ipoteza nulă de 
normalitate. 

Figura 20.1 arată conturile de 1,5 si 10% pentru testul Sha- 
piro, Wilk W pentru normalitate pentru n = 20 ce pund la 
valorile lui W de 0,868; 0,905 si respectiv 0,920. Valorile mici ale 
lui W indică depărtarea de normalitate, astfel că configuratiile ce 
corespund la puncte în afară conturului de 5% vor fi identificate de 
testul W ca semnificativ nenormale. Contururile apropiate ilustrează 
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că testul W este sensibil la formele de nenormalitate cu cozi lungi, 
oblice 81 simetrice, reprezentate de prezenţa uneia sau a două date 
care diferă semnificativ de celelalte date (d.c.d.s.c.d.). 


od.cd.sc.d 
. la dreapta 


,9 d.c.d.s.c.d 
in fiecare parte 


Suprafetele sensibile si contururile sensibile permit să se compare 
comportarea statisticilor test alternative. Pentru a ilustra. aceasta, 
au fost examinate suprafetele sensibile pentru un număr de statistici 
pentru verificarea normalitátii folosind selecţii complete. Pentru 
simplificare Prescott (1976) discută 5 statistici și anume: 01, b, 
n 

(Cap. 17 $ 3), u = (n — HERY — Ya)/S unde 8? = Pi (Yi — Y), 
1 

W (14.2.2) si D (15.2.1). 

Pentru fiecare dintre aceste statistici, pentru selecţii de volum 
n = 20, Prescott (1976) a construit contururi sensibile corespunzind 
la teste cu pragurile de semnificaţie de 5%. Aceste contururi au tost 
determinate folosind teste bilaterale pentru JD, ba, u si D şi un test 
unilateral pentru W, în fiecare caz alternativa fiind că repartiţia 
sub cercetare nu este normală. 

Cele cinci contururi sensibile sînt arătate în fig. 20.2. Această 
diagramă arată proprietăţile nefavorabile ale statisticilor Vo, si ۰ 
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Y 


Amindouá au conturile deschise, ceea ce aratá cá, dupá cum era de 
aşteptat, Vb, nu este sensibil la nenormalitate simetrică, în timp ce u 
nu este sensibil la nenormalitate asimetrică. 


Fig. 20.2 


Această proprietate a lui w a fost pusă în evidenţă de rezultatele 
obținute prin simulare de Shapiro, Wilk (1965), d'Agostino (1971) 
şi Shapiro, Wilk, Chen (1968). 

Celelalte trei procedee test au contururi închise care se intersec- 
tează unele pe altele în mai multe locuri. Aceasta arată că un test 
este cel mai sensibil la un tip de nenormalitate în timp ce celălalt 
test este cel mai sensibil la un tip diferit de normalitate. In particualar, 
diagrama arată că este greu de ales între D şi W, şi că din aceste 
teste considerate 8, este bun pentru situaţiile asimetrice iar b, este 
uşor sensibil la nenormalitate simetrică. Bowman, Shenton (1975), 
confirmă că se poate folosi un test ce combină JD, şi bo. 

: Un avantaj al acestei metode este cá orice alt procedeu test 
poate fi comparat cu cele considerate aici prin suprapunerea con- 
turului său sensibil pe Fig. 20.2. : 

Se poate argumenta că nu sînt reprezentate de aceste confi- 
guratii un număr de situaţii nenormale. Cu toate că acest lucru este 
adevărat, multe din situaţiile care apar în practică sînt acoperite şi 
o indicație suficient de bună a rezultatelor probabile a unui studiu 
empiric poate fi obţinută prin compararea contururilor sensibile. 
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1,00000 


e 9 10 | 11 13 14 15 16 
1 | 0,00094 „00036 „00014 | 0 , 00002 | 0,00001 | 0,00000 | 0,00000 
2 | 0,21261 25128 „20100 | 0, 16014 ,12715 | 0,10066 | 0,07950 | 0,06265 
3 | 0,78442 „72946 | 0,67502 | 0 , 57136 | 0,52323 | 0,47795 | 0,43564 
4 | 0,96121 „94101 „91747 | 0 „86304 | 0,83337 | 0,80275 | 0,77158 
5 | 0,99615 ,99222 | 0,98648 | 0 , 96935 | 0,95807 | 0,94517 | 0,93081 
6 | 0, 99982 „99943 „99865 | 0, 99732 , 99530 | 0,99250 | 0,98882 | 0,98425 
7 | 1,00000 „99998 „99993 | 0 „99953 | 0,99908 | 0,99837 | 0,99736 
8 00000 „00000 | 0,99999 99997 | 0,99993 | 0,99984 | 0,99968 
9 1, 00000 , 00000 | 1,00000 | 0,99999 0, 99997 
10 1,00000 | 1,00000 

NI 

17 18 19 21 22 23 24 
0, 00000 „00000 „00000 | 0 „00000 | 0,00000 | 0,00000 | 0,00000 
0, 4927 „03869 „03033 | 0 ,01857 | 0,01450 | 0.01132 | 0,00882 
0.39630 „35991 „32636 | 0, 0,24147 | 0.2 0,19650 
| 0, 70019 „70887 , 67784 | 0. 11733. | 0,58811-| 0.55970 | 0,53216 
| 0,91517 , 89844 ۲9 | 0, „84335 82: 0, 80401 | 0, 78392 
0, 97875 97235 | »10.,t 0.94802 | 0,9 0.92805 | 0,91712 
0,99598 | 0,99419 | 0, , 98605 | 0.98236 | 0,97817 | 0,97349 
0,99944 „99907 | 0,99856 | 0. 99700 | 0,99590 | 0,99456 | 0,99296 
0.99925 „99989 | 99980 | 0,9: 99949 | 0.99924 | 0,99890 | 0,99846 
1, 00000 „99999 | 0,99998 | 0,99996 , 99993 | 0,99989 | 0,99982 | 0,99973 
, 00000 | „00000 | 1,00000 „00000 | 0,99999 | 0,99998 | 0, 99996 


1,00000 
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Tabelul 6 (continuare) 


c 25 26 27 28 29 30 31 32 
| 
1 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 
2 | 0,00687 | 0,00535 | 0,00416 | 0,00323 | 0,00251 | 0,00195 | 0,00151 | 0,00177 
3 | 0,17702 | 0,15935 | 0,14334 | 0,12885 | 0,11575 | 0,10392 | 0,09325 | 0,08363 
4 | 0,50554 | 0,47987 | 0,45517 | 0,43145 | 0,40870 | 0,38693 | 0,36612 | 0, 34624 
5 | 0,76378 | 0,74338 | 0,72309 | 0,70288 | 0,68280 | 0,66290 | 0,64323 | 0,62382 
6 | 0,90565 | 0,89368 | 0,88128 | 0,86851 | 0,85541 | 0,84203 | 0,82843 | 0,81463 
7 | 0,96832 | 0,96269 | 0,95661 | 0,95010 | 0,94318 | 0,93588 | 0,92822 | 0,9202: 
8 | 0,99110 | 0,98895 | 0,98651 | 0,98378 | 0,98076 | 0,97745 | 0,97384 | 0.96995 
9 | 0.99792 | 0,99725 | 0,99645 | 0,99551 | 0,99441 | 0,99315 | 0,99172 | 0,99012 
10 | 0,99960 | 0,99943 | 0,99921 | 0,99894 | 0,99861 | 0,99821 | 0,99773 | 0,99717 
11 | 0,99994 | 0,09990 | 0,99985 | 0,99979 | 0,99971 | 0,99960 | 0,99946 | 0,99930 
12 | 0,99999 | 0,99999 | 0,99998 | 0,99997 | 0,99995 | 0,99992 | 0,99989 | 0,99985 
13 | 1,00000 | 1,00000 | 1.00000 | 1,00000 | 0,99999 | 0,99999 | 0,99998 | 0,99997 
14 | 1,00000 | 1,00000 | 1,00000 | 1.00000 
n 

c 33 34 35 | 38 [| 87 38 39 40 

1 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 
2 | 0,00091 | 0,00070 | 0,00054 | 0,00042 | 0,00033 | 0,00025 | 0,00020 | 0,00015 
3 | 0,07497 | 0,06177 | 0,06016 | 0,05386 | 0,04820 | 0,04312 | 0,03856 | 0,03448 
4 | 0,32729 | 0,30923 | 0,29205 | 0,27570 | 0,26018 | 0,24544 | 0,23145 | 0.21819 
5 |'0,60470 | 0,58590 | 0,56744 | 0,54934 | 0,53161 | 0,51427 | 0,49733 | 0,48078 
6 | 0,80069 | 0,78663 | 0,77250 | 0,75831 | 0,74410 | 0,72990 | 0,71572 | 0, 70159 
7 | 0,91192 | 0,90332 | 0,89447 | 0,88538 | 0,87608 | 0,86658 | 0,85690 | 0,94707 
8 | 0,96578 | 0,96134 | 0,95664 | 0,95168 | 0,94648 | 0,94104 | 0,93539 | 0,092952 
9 | 0,98834 | 0,98638 | 0,98423 | 0,98191 | 0,97939 | 0,97670 | 0,97382 | 0.97077 
10 | 0,99652 | 0,99578 | 0,99494 | 0,99399 | 0,99294 | 0,99178 | 0,09050 | 0,98910 
11 | 0,99910 | 0,99886 | 0,99857 | 0,99824 | 0,99785 , 0,99741 | 0,99692 | 0,99636 
12 | 0,99980 | 0,99973 | 0,99965 | 0,99954 | 0,99952 | 0,99928 | 0,99911 | 0 99891 
13 | 0,99996 | 0,99994 | 0,99992 | 0,99990 | 0,99986 | 0,99942 | 0,99977 | 0,99971 
14 | 1,00000 | 0,00000 | 0,99999 | 0,99998 | 0,99997 | 0,99996 | 0,99995 | 0.99993 
15 1,00000 | 1,00000 | 1,00000 | 0,99999 | 0,99999 | 0,99999 | 0.99999 

n 

c 41 42 ae as 45 | 46 47 48 

1 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0, 00000 
2 | 0,000122| 0,00009 | 0,00007 | 0,00005 | 0,00004 | 0,00002 | 0,00002 
3 | 0,03081 | 0,02753 | 0,02459 | 0,02196 | 0,01860 | 0,01561 | 0,01393 
4 | 0,20562 | 0,19373 | 0,18247 | 0,17181 | 0,16174 | 0,15222 | 0, 3 | 0,13474 
5 | 0,46464 | 0,44891 | | 0,41868 | 0,40418 | 0,39008 | 0, | 0136310 
6, 0,68752 | 0,67354 0, 64588 | 0,63223 | 0,61872 | 0, 6 | 0,49215 
7 | 0,83711 | 0,82702 | 0, 80657 | 0,79 0, 33 | 0,77539 | 0,76492 
8 | 0,92345 | 0,91719 | 0,90415 | 0,89739 | 0,89048 | 0,88344 | 0, 87628 
9 | 0,96754 | 0,96413 | 0. | 0, 95682 | 5293 | 0,94888 | 0,94467 | 0 94033 
10 | 0,98759 | 0,98596 | 0,98431 | 0,98233 | 0,98033 | 0,97822 | 0,97598 | 0.97363 
11 | 0,99573 | 0,99504 | 0,99428 | 0,99344 | 0,99253 | 0.99154 0, 98933 
2 | 0,99868 | 0,99842 | 0,99813 | 0,99779 | 0,99742 |.0,99701 | 0,99655 | 0.99605 
13 | 0,99963 | 0,99955 | 0,99945 | 0,09933 | 0,99199 | 0,99904 | 0,99886 | 0, 99866 
14 | 0,99991 | 0,99988 | 0,99985 | 0, 99982 | ) 0,99972 | 0,99966 | 0,89959 
15 | 0,99998 | 0,99997 | 0,99996 | 0,99995 | 0,99993 | 0,99991 | 0,99988 
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Tabelul 6 (continuare) 


= E 50 51 59 53 54 55! | .56 

1 | 0.00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 
2 | 0,00001 | 0,00001 | 0,00001 | 0,00001 | 0,00001 | 0,00000 | 0,00000 | 0,00000 
3 | 0,12422 | 0,01108 | 0,00988 | 0,00880 | 0,00785 | 0,00699 | 0,00623 | 0,00555 
4 | 0,12672 | 0,11916 | 0,11203 | 0,10530 | 0,09896 | 0,09298 | 0,08735 | 0,08205 
5 | 0,35020 | 0,33769 | 0,32556 | 0,31381 | 0,30242 | 0,29140 | 0,28073 | 0,27041 
6 | 0,57911 | 0,56623 | 0,53353 | 0,54101 | 0,52868 | 0,51654 | 0,50459 | 0,49283 
7 | 0,75442 | 0,74392 | 0,73342 | 0,72294 | 0,71247 | 0, 70203 | 0,69162 | 0,068126 
8 | 0,86899 | 0,86160 | 0,85412 | 0,84654 | 0,83889 | 0,83116 | 0,82337 | 0,81552 
9 | 0,93584 | 0,93122 | 0,92648 | 0,92161 | 0,91662 | 0,91152 | 0,90632 | 0,90102 
10'| 0,97115 | 0,96856 | 0,96586 | 0,96304 | 0,96011 | 0,95708 | 0,95393 | 0,95069 
11 | 0,98810 | 0,98679 | 0,98540 | 0,98392 | 0,98237 | 0,98073 | 0,97900 | 0,97720 
12 | 0,99550 | 0,99490 | 0,99425 | 0,99356 |.0,99280 | 0,99200 | 0,99113 | 0,99022 
13 | 0,99844 | 0,99820 | 0,99792 | 0,99762 | 0,99729 | 0,99693 | 0,99656 | 0,99611 
14 | 0,99951 | 0,99941 | 0,99931 | 0,99919 | 0,99906 | 0,99891 | 0,99875 | 0,99857 
15 | 0,99986 | 0,99983 | 0,99979 | 0,99975 | 0,99970 | 0,99964 | 0,99958 | 0,99951 

n 

e 57 58 59 60 MORE ENN, 60200 68 

1 | 1,00000 | 1,00000 | 1,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 
2 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 
3 | 0,00494 | 0,00440 | 0,00392 | 0,00349 | 0,00310 | 0,00276 | 0,00246 | 0,00219 
4 | 0,07706 | 0,07236 | 0,06793 | 0,06377 | 0,05986 | 0,05617 | 0,05271 | 0,04946 
5 | 0,26042 | 0,25077 | 0,24144 | 0,23242 | 0,22371 | 0,21529 | 0,20717 | 0,19933 
6 | 0,48128 | 0,46992 | 0,45876 | 0,44780 | 0,43705 | 0,42649 | 0,41614 | 0,40559 
7 | 0,67094 | 0,66068 | 0,65049 | 0,64035 | 0,63029 | 0,62030 | 0,61040 | 0,60057 
8 | 0,80762 | 0,79968 | 0,79171 | 0,78370 | 0,77567 | 0,76761 | 0,75955 | 0,75148 
9 | 0,89562 | 0,89013 | 0,88455 | 0,87889 | 0,87316 | 0,86736 | 0,86150 | 0,85557 
10 | 0,94734 | 0,94390 | 0,94036 | 0,93674 | 0,93302 | 0,92021 | 0,92533 | 0,92136 
11 | 0,97531 | 0,97334 | 0,97129 | 0,96916 | 0,96695 | 0,96466 | 0,96230 | 0,95986 
12 | 0,98924 | 0,98821 | 0,98712 | 0,98598 | 0,98477 | 0,98351 | 0,98218 | 0,98080 
13 | 0,99565 | 0,99515 | 0,99462, | 0,99406 | 0,99345. | 0,99281 | 0,99212 | 0,99140 
14 | 0,99837 | 0,99815 | 0,99791 | 0,99765 | 0,99737 | 0,99707 | 0,99674 | 0,99639 
15 | 0.99943 | 0,99934 | 0,99923 | 0,99914 | 0,99902 | 0,99889 | 0,99874 | 0,99858 

n 

000 08. |. , 66 BT E ABA a BOSE ie" ی‎ She 429 

1 0, 00000 | 0,00000 | 0,00000 | 0,00090 | 0,00000 | 0,00000 | 0,00000 | 0,00000 
2 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 | 0,00000 
3 | 0,00195 | 0,00173 | 0,00154 | 0,00137 | 0,00122 | 0,00108 | 0,00096 | 0,00086 
4 | 0,04640 | 0,04352 | 0,04082 | 0,03828 | 0,03589 | 0,03365 | 0,03155 | 0,02958 
5 | 0,19176 | 0,18445 | 0,17751 | 0,17061 | 0,16406 | 0,15774 | 0,15165 

6 | 0,39603 | 0,38628 | 0,37672 | 0,37736 | 0,35819 | 0,34921 | 0,34043 

7 | 0,59083 | 0,58119 | 0,57163 | 0,56217 | 0,55280 | 0,54354 | 0,53437 

8 | 0,74340 | 0,73533 | 0,72726 | 0,71919 | 0,71115 | 0,70311 | 0,69510 | 

9 | 0,84958 | 0,84355 | 0,83746 | 0,83133 | 0,82516 | 0,81895 | 0,81271 |-0, 8074 
10 | 0,91731 | 0,91320 | 0,90901 | 0,90475 | 0,90042 | 0,89604 | 0,89519 | 0,88709 
11 | 0,95735 | 0,95476 | 0,95211 | 0; 94938 | 0,94659 | 0,94373 | 0,94080 | 0,93781 
12 | 0,97936 | 0,97786 | 0,97630 | 0,97459 | 0,97301 | 0,97128 | 0,96950 | 0,96865 
13 | 0,99063 | 0,98983 | 0,98898 |. 0,98908 | 0,98716 | 0,98619 | 0,98518 | 0,94172 
14 | 0,99602 | 0,99562 | 0,99519 | 0,99474 | 0,99425 | 0,99374 | 0,99321 | 0,99264 
15 | 0,99841 | 0,99823 | 0,99803 | 0,99781 | 0,99758 | 0,99733 | 0,99707 | 0,99678 


357 


0, 00000 
0, 00000 
0, 00076 
0, 02772 
0,14013 
0, 32342 


0,51635 | 
0, 67916 


0, 80014 
0, 88253 
0,93476 
0, 96576 
0, 98301 
0,99204 
0, 99548 


81 
0,00000 
0, 00000 


0,00030 | 


0,01647 
0,10178 
0, 26253 
0,44855 
0,61675 
0, 74917 
0, 84442 
0, 90833 
0,94867 


| 0,97268 


0,98618 
0,99336 


¢ 89 
1 0, 00000 
2 | 0,00000 
3 | 1 
4 0, 00973 
5 0,07357 
6 0,21207 
7%] 0,38775 | 
8 | 0,55735 
9 0, 69806 
10 | 0,80421 
11 | 0,87892 
12 | 0,92851 
13 | 0,95969 
14 | 0,97830 
15 | 0,98884 
358 


0, 00000 , 00000 
0,00000 | 0, 00000 
0, 00068 , 00060 


0,31519 
0, 50750 
0, 67123 


„30714 
„49875 
„66333 


0, 79382: | 0, 78748 | 0, 78112 
0, 87792 | 0,87326., 0,86856 
0,93165 | 0,92848 |.0,92525 
0, 96380 | 0, 96180 | 0, 95974 
0,98187 | 0,98069, | 0,97946 
0,99142 | 0,99076 | 0,99008 


0, 99616 , 99482 


| 81. 
| 0,00000 | 0,00000 
| 0,00000 | 0, 00000 
0,00026 | 0,00023 
| 0,01542: | 0, 4 
0,09876 | 0,09389 | 
0,25569 | 0,24900 
0,44056 | 0,43269 
0, 60914 | 0,60159 
0, 74276 | 0, 73636 
0,83949 | 0,83452 | 
0,90480 | 0,90123 
0,94630 | 0,94390 
0,97119 | 0,96967 
0,98531 | 0,98440 
| 0,99287 | 0,99237 


T 
65 


90 
0, 00000 
0, 00000 
0 
0.00911 
0.07063 
0,20643 
0 
0, 55018 
0, 69172 


91 


| 0, 00000 


0.06779 


0, 79909 | 0,793 
0,87507 | 0,87119 | ( 
0,92580 | 0,92305 | ( 


0,95789 
0,97717 


0, 95605 | > 


0,98818 | 0,98748 | ( 


0.00000 0. 


„00010 | 0.00009 | 0 
| 0,00853 | 0, 


0.20092 | 0, 
,38064 | 0,37364 | 0 
0,54306 | 0, 


395 0, 


0,00000 
0,.00000 
0, 00053 


0,02598 | 0,02435 | 0,02282 
0,13468 | 0,12943 | 0,12438 


0 
0 
0 


529928 
349011 
„63546 


0,99546 
n 


84 
0, 00000 


0,00000 | 


0, 00021 
0,01353 
0,09017 
0, 24247 
0, 42493 
0, 59408 
0, 72996 
0,82953 
0,89761 
0, 94144 
0,96811 
0, 98346 
0, 99184 


92 
00000 
, 00000 
„00008 
00798 


53600 
), 67908 
78880 
), 86728 
), 92026 


9: ), 95418 
0,97601 | 0,97482 


), 98677 


„06507 
19455 


36674 | 


0, 00000 
0, 00000 


0,119: 
| 0,29159 
| 0, 48158 


0, 86381 
0,92197 
0, 95762 
0,97819 
| 0,98936 
0, 99508 


85 
9, 00000 
0, 00000 
0, 00018 
0, 01267 
0, 08659 
0,23609 | 
0, 41727 
0, 58662 
0, 72356 
0, 82451 
0, 89395 
0, 93894 
0, 96650 | 
0,98249 | 
0,99129 


| 
| 
| 
| 
| 
| 


| 0, 00047 | 
0, 02138 


| 0,64764 | 


| 0, 77475 | 


| 
| 
| 


| 0, 00016 


| 0,89025 


0, 00000 
0,00000-| 0, 00000 
0,00042 | 0, 00037 
0,02003. | 0,01877 
| 0,11482 |-0,11031 
0, 28408.| 0,27672 


0, 00000 


0,47316 | 0,46485 
0,63985 | 0,63211 
0, 76836 | 0,76197 
0,83902 | 0, 85419 
0,91864 0;91525 


0,95546.| 0, 95324 
0,97687 |'0, 97552 
0,98861 | 0,98783 
0, 99468 | 0, 99426 


86 87 
0, 00000 y 
0, 00000 


0, 00000 
| 0, 00015 
0,01110 
0, 07983 
0,22986 | 0.22379 
0,40973 | 0, 40229 
0,57922 | 0,57188 
0,71717 | 0, 71079 
0,81947 | 0,81440 
| 0, 88651 

| 0,93381 


| 


0, 01186 
0,08314 


0,93640 
0, 96486 
0,98149 
0,99071 | 


0, 98046 
0, 99011 


94 . | 
| 0, 00000 
| 0,00000 | 
| 0, 00006 
| 0,00699 | 


), 5220 
0, 66651 
0, 77847 
0,85937 

| 0,91457 
0, 95032 
| 0,97234 
| 0,98526 


| 0,34021 


96 98 

0,00000 | 0, 00000 
0,00000 | 0,00000 
0,00005 | 0,00004 
0,00612 | 0.00536 
0,05520-| 0,05082 
0,17536 | 0,16600 
|/0,32757 
0,50839 | 0,49496 


| 0, 65403 | 0,64165 


0,76810 | 0, 75771 
0,85136 | 0,84324 
0.90874 

0.94632 | 0,94218 
0,96974 | 0;96702 
0,98366 | 0,98196 


Tabelul 6 (continuare) 


0,00000 | 


| 0,96317.| 


0, 00000 
0, 00000 
0, 00033 
| 0,01758 
| 0,10597 
0, 26955 
0,45664 
0.62441 
| 0, 75557 
| 0,84932 
0,91182 
0,95098 
1:0,97412 
! -0,98702 
0, 09382 


| 시아 그 ee, ah ae TIRE le ee 


88 
0, 00000 
0, 00000 
0, 00013 
0, 01040 
0, 07664 
0,01786 
| 0,39497 
0, 56459 
| 0, 70442 
0, 80932 
0, 88273 
| 0,93118 
0,96145 
0,97939 
| 0,98949 


100 
0, 00000 
0, 00000 
| 0,00003 
| 0,00469 
0, 04678 


| 0,15712 


0; 34583 


| 0,48178 


0, 62937 
0, 74731 


| 0,83504 
0,90278 ¡ 


0, 89670 
0, 93791 
0, 96417 


0, 98016 


Tabelul 7 


Funcţia de repartiție a statisticii Kolmogorov — Smirnov pentru două selecţii 


D*(n, n) = sup {Fp(x) — Gpn(x)}: 
x 


valoarea tabelată. 


P {Dt (n, n) > ۲ 


n 


0, 166666 0, 142857 


0, 500000 0, 333333 0, 250000 0, 200000 


0, 523809 0, 464285 


0, 600000 
0, 885714 
0, 985714 


0, 833333 0, 700000 
0, 950000 


1.000000 


1, 000000 


0, 821428 0,761904 


1,000000 


0,960317 0,928571 


0,996051 0,987012 


| 4,000000 
0,998917 


1,000000 | 
| 


1, 000000 


„125000 0,111111 0,100000 0,090909 0,083333 


318181 0, 294871 


,416666 0, 377777 0, 345454 0, 


„660606 0,618181 0, 580419 0, 546703 


o 


, 708333 ( 


0,858585 0, 323776 0, 790209 0, 758241 0, 728021 


, 893939 


973484 0, 956487 0, 937062 0,916083 0, 894230 0, 872010 


950226 


, 990675 0, 983216 0,973776 0, 962669 0, 


„995920 ( 


984281 


0, 989630 0, 


, 998756 0, 996853 , 993829 


a 
lori 
© 


„999708 


„998971 0, 997816 0, 996070 


, 999922 


0, 999629 


~ 


„000000 


0, 999979 , 999891 0, 999672 0, 999251 


= 


, 000000 


0, 999994 0, 999968 0, 999897 


1,000000 


0,999991 
0,099995 


1, 000000 0, 999998 


1,000000 


1.000000 


359 


0 0, 071428 
1 0,257142 
2 0, 489285 
3 0, 699579 
4 0, 849798 
5 0, 936753 

6 0, 977863 

7 0,993675 

8 0,998562 

9 0, 999750 
10 0, 999968 
11 0, 999997 
12 0, 999999 
13 1,000000 


o | 0,050000 
1 | 0,185714 
2 | 0,370779 
3 | 0,562281 
4 | 0, 726425 
5 | 0,846798 
6 | 0,923399 
7| 0,965955 
8| 0,986625 

9 | 0,995388 
10 | 0,998616 
11 | 0,999642 
12 | 0.999921 
13 | 0,999985 
14 | 0.999997 
15 | 0,999999 
16 | 1,000000 
17 | 1,000000 
18 | 1,000000 
19 | 1,000000 


14 


0, 066666 
0, 241666 
0,464705 
0,672875 
0, 827829 
0,922523 
0,970485 
0, 990608 
0,997550 
0, 999489 
0,999918 
0,999990 
0, 999999 
1,0000000 
1,000000 


0,047619 
0,177489 
0, 356295 
0; 544042 
0, 708187 
0, 831646 
0,912705 
0,959470 
0, 983229 
0, 993850 
0, 998016 
0,999442 
0, 999864 
0,999972 
0,999995 
0, 999999 
0,999999 
1,000000 
1,000000 
1,000000 
1, 000000 


0,062500 
0, 227941 
0, 442401 
0, 647832 
0, 806308 
0, 907765 
0, 962267 
0, 986875 
0,996172 
0, 999081 
0, 999823 
0; 999973 
0, 999997 
0, 999999 
1,000000 
1,000000 


0, 045454 
0,169960 
0, 342885 
0, 526877 
0, 690640 
0, 816681 
0, 901793 
0, 952590 
0, 979455 
0, 992047 
0, 997266 
0,999171 
0, 999780 
0,999949 
0, 999990 
0, 999998 
0, 999999 
1, 000000 
1, 000000 
1, 000000 
1, 000000 


16 


0, 058823 
0, 215686 
0, 422084 
0, 624354 
0, 785345 
0, 892672 
0,953336 
0, 982500 
0, 994400 
0, 998492 
0, 999664 
0, 999940 
0, 999991 
0, 999999 
1, 000000 
1, 000000 
1, 000000 


0, 043478 
0,163043 
0, 330434 
0,510702 
0, 673801 
0, 801950 
0, 890731 
0, 945365 
0, 975326 
0, 989976 
0,996355 
0, 998820 
0,999663 
0, 999915 
0, 999981 
0, 999996 
0, 999999 
1, 000000 
1, 000000 
1, 000000 
1, 000000 


0, 204678 
0, 403508 
0, 602339 
0, 765018 
0, 877401 
0,943808 
0,977523 
0,992219 
0,997694 
0, 999423 
0, 999880 
0, 999980 
0, 999997 
0, 999999 
1,000000 
1,0000000 
1,000000 


0,041666 
0, 156666 
0, 318846 
0, 495441 
0, 657621 
0, 787488 
0,879577 
0, 937846 
0,970865 
0, 987639 


0, 998379 
0, 999504 
0, 999866 
0, 999968 
0, 999993 
0, 999998 
0, 999999 
1, 000000 
1, 000000 
1, 000000 


Tabelul 7 (contin uare) 


0, 052631 
0,194736 
0, 386466 
0,581681 


2076 
0,933796 
0, 971990 
0, 989626 
¢, 996665 
0, 999080 
0, 999785 
0,999958 
0, 999993. 
0, 999999: 
0, 999999 
1, 000000: 
1, 000000: 
1, 000000: 


0, 040000 
0, 150769 
0, 308024 
0, 481025 
0, 642086. 
0, 773321 
0, 868380, 
0, 930077 
0, 966097 
0, 985043 
0, 994017 
0, 997839: 
0, 999299 
0,999797 
0, 999948 
0, 999988. 
0, 999997 
0, 999999 
1, 000000: 
1, 000000: 
1, 000000» 


© 00-10) 여느 0o IN e O 


10 
11 
12 
13 
14 
15 
16 
17 
18 
19 
20 


c 


NDOA دن‎ I نا‎ 


0, 038461 
0, 145299 
0, 297924 
0, 467390 
0, 627173 
0, 759466 
0, 857183 
0, 922100 
0, 961050 
0, 982194 
0, 992581 
0, 997192 
0, 999039 
0, 999704 
0,999918 
0, 999980 
0, 999995 
0,999999 
0, 999999 
1, 000000 
1,000000 


0, 031250 
0,119318 
0, 248830 
0,399064 
0,549298 
0, 683290 
0, 791638 
0, 871777 
0, 926272 
0, 960438 
0, 980219 
0, 990799 
0, 996027 
0, 998410 
0, 999412 
0, 999800 
0, 999937 
0, 999982 
0, 999995 
0,999998 
0,999999 


0,037037 
0,140211 
0, 288451 
0, 454479 
0, 612856 
0, 745936 
0, 846022 
0, 913953 
0, 955747 
0,979103 
0, 990963 
0,996432 
0,998719 
0,999583 
0,999878 
0,999968 
0,999992 
0,999998 
0, 999999 
1, 000000 
1,000000 


0, 030303 
0,115864 
0, 242169 
0, 389525 
0, 538019 
0, 671750 
0, 781167 
0, 863229 
0, 919939 
0, 956157 
0, 977568 
0, 989294 
0, 995241 
0, 998034 
0, 999247 
0, 999733 
0, 999912 
0, 999973 
0, 999992 
0,999998 
0,999999 


0,035714 
0,135467 
0,379556 
0, 442237 
0, 599108 
0, 732738 
0, 834926 
0, 905672 
0, 950216 
0,975780 
0, 989165 
0, 995554 
0, 998333 
0, 999430 
0, 999823 
0, 999950 
0, 999987 
0, 999997 
0, 999999 
0, 999999 
0, 999999 


0,028571 
0,109523 
0, 229859 
0,371726 
0,516712 
0,649616 
0,760713 
0,846173 
0, 906988 
0,947152 
0,971814 
0, 985907 
0, 993403 
0,997113 
0, 998821 
0, 999552 
0, 999841 
0, 999948 
0, 999984 
0,999995 
0,999998 


0, 034482 
0,131034 
0,271190 
0, 430617 
0, 585903 
0, 719875 
0,823922 
0, 897287 
0,944479 
0,972239 
0,987187 
0,994554 
0,997875 
0,999241 
0,999752 
0,999926 
0,999980 
0,999995 
0,999998 
0,999999 
0,999999 


0, 027027 
0,103840 
0,218732 
0, 355454 
0, 496940 
0, 628693 
0, 740949 
0, 829262 
0, 893763 
0,937643 
0, 965504 
0,982033 
0,991200 
0,995952 
0,998253 
0,999294 
0,999733 
0,999906 
0,999969 
0,999990 
0,999997 


0,033333 
0,126881 
0, 263306 
0,419574 
0, 573217 
0, 707348 
0, 813028 
0, 888827 
0, 938562 
0, 968493 
0, 985034 
0, 993429 
0, 997340 
0, 999010 
0, 999662 
0, 999895 
0, 999970 
0, 999992 
0, 999998 
0, 999999 
0, 999999 


0, 025641 
0,098717 
0,208630 
0, 340525 
0, 4 
0, 608916 
0,721895 
0,812582 
0, 880371 
0, 927724 
0, 958699 
0,977697 
0, 988630 
0,994533 
0,997524 
0, 998945 
0,999578 
0,999841 
0,999944 
0,999981 
0,999994 
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0, 032258 
0, 122983 
0, 255865 
0, 409069 
0, 561022 
0, 695154 
0, 802262 
0, 880316 
0, 932486 
0, 964555 
0, 982709 
0, 992178. 
0,996725 
0,998734 
0, 999550 
0,999853 
0,999956 
0,999988 
0,999997 
0,999999 
0,999999 


0, 024390 
0,094076 
0,199417 
0, 326782 
8,461425 
0,590215 
0,703559 
0, 796197 
0, 866904 
0,917480 
0,951459 


0,985698 
0,992849 
0,996619 
0,998490 
0,999364 
0,999748 
0, 999905 
0,999967 
0,999989 
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Lista subprogramelor 


"amv uta 1 | 


Nume Punctul Tip | Parametrii | Ce calculează 
| | 
————————————————————————À 
ALAMB 1.10.4 | ۲ |P1, PO,K,N parametrul A din T1.5.4. 
ALBE 10.53 | S |X. N, ALFA, BETA! estimarea lui a si 8 
ALFA1 10.5.1 ۱2۲ BETA estimarea lui a 
BETA1 10.5.2 F |X,N,ALFA estimarea lui 8 
CSY 12.4.3 qu WE X, N statistica Csörgö 
DMAX 5.11.15 F X, N tabel Massey 
DNALFA 5.11.7 F IN, ALFA, DNA valoarea lui Dy din tabel 
1۷1 N2,N3, 
ALFA1 
DNE 5.11.10. F X, N selectia de volum 
DNK 5.11.8. F |X, N, TETA1 | ۹ 
¡TETA 2 statistica D, 
DNL 5.11.9. F |X,N statistica Lilliefors 
DNS 5.14011: | oF X, N statistica Srinivasan 
DNT 5.11.14. F X,N,T statistica Kolmogorov-Smirnov 
pt. date trunchiate 
EROARE 1.10.3 F P,K,N,C eroarea aproximarii lui P(X?- ê) 
| | cu P(X2(K—1)<c) 
ESTCON 3.4.1, | F X,N,K estimatorul consistent 
FI 1.10.5. 1 Ule. d funcţia Laplace 
FJ dake: Liu NJ |DF;(Y;) 
FM 5:11:12: I | X, N;X1 functia Moore 
FN P4135... J^ Br ANA functia F, 
HIPT 1.10.1 | F و۷‎ A 
HIPTAK 1.10.6. | F |ALFA, K l-a (K—1) 
HIPTC 3.4.3. | F |X NM Xe 
HIPTM 3.4.7, | FE. |X,N,M xe 
HIPT\ 3.4.4, | F 7 X» 
HIPT1 1.1072. os să INK |X? cu probabilitáti egale 
K1 1.10.8. | F  |NALFA numárul de intervale pentru testul 
| | de normalitate 
LIM 5.11.5. I» bs DNALFA, S, XLN, |limitele pentru banda de ineredere 
| XUN 
NOR VER LJ. | F |X,N,K,ALFA,L verificarea normalitatii 
OMEGA 6.8.1. | F | XN, n à 
RC 18.3.1; F X,N s 
S 854.2. F X,N,K statistica din (3.1.4) 
SAD B 2. F X,N statistica Anderson Darling 
SD 5.11.4. S X,N,DP,DM,D statistici Kolmogorov 
SDA 15.4.1. F X,N statistica D'Agostino 
SN 5/11.2; F X,N,X1 functia empiricá 
SORT DAT S X,N ordonarea elementelor 
SPN ]12.4.2. F XN statistica Pearson 


M | 


| | 
Nume | Punctul | Tip | Parametri 
| 

MEE uo Ter T. | 
SVN 18.7.1 A | F |X,N 
SW [14.6.1. O ANA 
TESTAJ 3.4.8. | S |X,N,M,ALFA 
TETA1 19.4.1. | ^B A Seay 
TPN [19.4.1. | F |X,N,P 
UALFA [3.4.6. F [ALFA 
UNPT [7.9.1. | B DX 
Z | 5 | F |X,N,M 
Xn | IF |X,N,TETA 


Continuare anexă 
| Ce calculează 
| 


(statistica Kuiper 
[statistica W 
(este cu XG, Xp, ZM Xi 
jestimarea lui 0 
[statistica T, 

Uy 

statistica Watson 
[statistica Z 
jestimarea lui £ 


Observaţie: La tip am notaticu S — subprogram subrutiná, si cu F — subprogram 


funcție. 
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